Google розмістив у магазині безкоштовний AI для диктування «Edge Eloquent»: працює на мобільному пристрої з Gemma, без потреби в підключенні до мережі, старт на iOS

動區BlockTempo

Google непомітно розмістив у iOS App Store безплатний офлайн-застосунок для AI-диктування «AI Edge Eloquent». У ньому використовується модель Gemma ASR на стороні пристрою: аудіо повністю не залишає пристрій, і, що рідко трапляється, ця функція спершу з’явилася на платформі iOS, а не на Android.
(Передісторія: Google випустив найрозумнішу відкриту модель Gemma 4! Повністю перейшов на ліцензію Apache 2.0, продуктивність прямо на рівні великих закритих AI)
(Додаткова довідка: зламати монополію Nvidia? Google — найсильніша на Землі AI-модель «Gemma 3» на 1 H100, перемагає DeepSeek, OpenAI)

Зміст

Toggle

  • Говориш — і перетворюється на текст, заговорив — і вже можна користуватися
  • iOS випереджає Android, Google робить нетипову для себе операцію
  • Gemma у повсякденні: реальна перевірка сценаріїв для AI на стороні пристрою

Без пресконференцій і без будь-яких офіційних оголошень Google буквально цього тижня трохи раніше непомітно виклав «AI Edge Eloquent» у iOS App Store. Цей повністю безплатний додаток для AI-диктування, ключовий акцент — офлайн-розпізнавання мови. За лаштунками працює власна від Google 端侧 ASR (автоматичне розпізнавання мовлення) модель Gemma на стороні пристрою: усі обробки аудіо виконуються локально на пристрої, без потреби в інтернеті.

Говориш — і перетворюється на текст, заговорив — і вже можна користуватися

Логіка роботи «AI Edge Eloquent» дуже інтуїтивна: відкрий застосунок, говори у мікрофон — на екрані миттєво з’являється текст і хвильова форма звуку. Після зупинки запису App автоматично фільтрує розмовні «паразитні слова» на кшталт «е-ем», виправляє розбиття на речення, приводить сказане до чистого, придатного для використання тексту й автоматично копіює його в буфер обміну.

Конфіденційність — один із ключових аргументів цієї програми. У режимі суто офлайн аудіодані не виходять за межі iPhone користувача: вони не передаються на жодні сервери. Google також надає опцію «хмарного режиму»: розпізнавання все одно виконується на стороні пристрою, а в хмарну модель Gemini надсилається лише розпізнаний текст (а не вихідне аудіо) для додаткового очищення — якість вища.

Уся послуга повністю безплатна: без підписки, без обмеження за обсягом використання.

iOS випереджає Android, Google робить нетипову для себе операцію

Паралельно технологічні медіа звернули увагу на рідкісне явище: продукти Google майже завжди спершу виходять на Android. Особливо це стосується функцій AI на стороні пристрою — зазвичай вони запускаються в парі з пристроями Pixel і моделлю Gemini Nano. Цього разу «AI Edge Eloquent» пішов навпаки: у описі в App Store навіть прямо зазначено, що версія для Android буде випущена.

Аналітики мають два тлумачення. Перше — тест ринку: Google, можливо, навмисно обрав iOS як «не свою» платформу для експерименту, щоб, не заважаючи екосистемі Android, оцінити, наскільки споживачі приймають і як користуються диктуванням із AI на стороні пристрою.

Друге — технічна готовність: модель Gemma ASR для iOS, ймовірно, раніше за Android досягла стадії оптимізації, на якій її можна використовувати на практиці. Тому Google вирішив одразу виставити застосунок, не чекаючи синхронного виходу на обох платформах.

Gemma у повсякденні: реальна перевірка сценаріїв для AI на стороні пристрою

З технічної точки зору «AI Edge Eloquent» важить більше, ніж просто інструмент для диктування. Gemma — це серія відкритих легких AI-моделей від Google; її задум — ефективно працювати в середовищах із обмеженими ресурсами, зокрема на мобільних пристроях. А AI Edge — це рамка від Google, що дає розробникам можливість запускати моделі машинного навчання безпосередньо на стороні пристрою.

Цей застосунок по суті переносить здібності Gemma до інференсу на стороні пристрою в звичайні щоденні сценарії використання для споживачів.

Для розробників AI Edge Eloquent також є зразковим кейсом: він показує, як модель Gemma приземляється в продуктах споживчого класу, і як гібридна архітектура офлайн і в хмарі може досягати балансу між конфіденційністю та якістю.

Застереження: Інформація на цій сторінці може походити від третіх осіб і не відображає погляди або думки Gate. Вміст, що відображається на цій сторінці, є лише довідковим і не є фінансовою, інвестиційною або юридичною порадою. Gate не гарантує точність або повноту інформації і не несе відповідальності за будь-які збитки, що виникли в результаті використання цієї інформації. Інвестиції у віртуальні активи пов'язані з високим ризиком і піддаються значній ціновій волатильності. Ви можете втратити весь вкладений капітал. Будь ласка, повністю усвідомлюйте відповідні ризики та приймайте обережні рішення, виходячи з вашого фінансового становища та толерантності до ризику. Для отримання детальної інформації, будь ласка, зверніться до Застереження.
Прокоментувати
0/400
Немає коментарів