Керівник великої моделі Xiaomi: коли конкуренція в AI переходить у епоху агентів, самовдосконалення є ключовою подією для AGI

AI自進化

Керівниця команди великомасштабних моделей Xiaomi Ро Фулі 24 квітня на платформі Bilibili провела глибинне інтерв’ю (номер відео: BV1iVoVBgERD). Тривалість інтерв’ю — 3,5 години; це її перше публічне, системне викладення технічних поглядів у ролі технічного керівника. Ро Фулі зазначила, що конкуренція у сфері великомасштабних моделей перейшла від епохи Chat до епохи Agent, а також вказала, що «самоеволюція» стане ключовою подією для AGI впродовж майбутнього року.

Від епохи Chat до епохи Agent: ключові технічні висновки

小米大模型團隊負責人羅福莉訪談

(Джерело: Bilibili)

Згідно з тим, що Ро Фулі заявила в інтерв’ю на Bilibili, вона вказала: у 2026 році фокус конкуренції великомасштабних моделей уже зміститься від якості універсальної розмови до здатності до безперервного автономного виконання складних завдань. Під час інтерв’ю вона сказала, що наразі топові моделі можуть автономно оптимізуватися для конкретних завдань і стабільно виконувати їх протягом 2–3 днів, без потреби в втручанні людини для коригування. В інтерв’ю вона наголосила, що прорив у «здатності до самоеволюції» означає, що AI-системи почали мати можливість самокорекції, і назвала технологічні траєкторії Anthropic та такі технічні змінні, як Claude Opus 4.6, які впливають на всю екосистему AI.

Коригування співвідношення обчислювальних потужностей у Xiaomi та оцінка різниці поколінь Pre-train

Згідно з розкриттям Ро Фулі під час інтерв’ю, у Xiaomi вже здійснили суттєві зміни в стратегії розподілу обчислювальних потужностей. Вона пояснила, що у галузі типовим є співвідношення обчислень Pre-train:Post-train:Inference = 3:5:1, тоді як поточна стратегія Xiaomi відкоригована до 3:1:1 — і в такий спосіб значно стиснуто частку обчислень для подальшого тренування, водночас підвищено інвестиції ресурсів на етапі інференсу.

У своєму інтерв’ю вона пояснила, що цей зсув зумовлений зрілістю стратегії Agent RL Scaling: після тренування більше не потрібно нагромаджувати великі обсяги обчислювальної потужності, а зростання ресурсів на інференсному боці відображає потребу сценаріїв впровадження Agent у можливостях негайної реакції.

Щодо проблеми різниці в поколіннях Pre-train у вітчизняних великомасштабних моделях, Ро Фулі під час інтерв’ю зазначила, що цю різницю вдалося скоротити з минулих 3 років до кількох місяців, а нинішній стратегічний фокус зсувається в бік Agent RL Scaling. Її кар’єрна траєкторія включає Інститут Дамo Алі (Алі Дамо), Quant ілюзію (Huanfang) та DeepSeek (DeepSeek-V2, головний розробник), а у листопаді 2025 року вона приєдналася до Xiaomi.

Технічні специфікації серії MiMo-V2 та відкриті рейтинги

Згідно з оголошенням Xiaomi від 19 березня 2026 року щодо серії MiMo-V2, цього разу одночасно випущено три моделі:

MiMo-V2-Pro: загальна кількість параметрів — десятки; увімкнено параметр 42B, архітектура змішаної уваги, підтримка мільйонного контексту, рівень завершення завдань 81%

MiMo-V2-Omni: сценарії Agent у всіх модальностях

MiMo-V2-TTS: сценарії синтезу мовлення

Згідно з оголошенням, MiMo-V2-Flash, який вже відкрито, у глобальному рейтингу відкритих моделей посів друге місце, а швидкість інференсу досягає 3 разів порівняно з DeepSeek-V3.2.

Поширені запитання

Як Ро Фулі визначає «самоеволюцію» і чому вважає її найключовішою подією для AGI?

Згідно з тим, як Ро Фулі описала під час інтерв’ю на Bilibili 24 квітня 2026 року (BV1iVoVBgERD), у ході інтерв’ю вона зазначила: нині топові моделі вже можуть автономно оптимізуватися для конкретних завдань і стабільно виконувати їх протягом 2–3 днів без втручання людини, а «самоеволюцію» вона кваліфікувала як найключовіше для розвитку AGI впродовж майбутнього року.

Які конкретні коригування зробила Xiaomi у співвідношенні обчислювальних потужностей, і яка логіка за цим стоїть?

Згідно з розкриттям Ро Фулі в інтерв’ю, співвідношення обчислювальних потужностей у Xiaomi змінили з типової для галузі Pre-train:Post-train:Inference = 3:5:1 на 3:1:1, суттєво стиснувши частку обчислень для подальшого тренування; вона пояснила, що це коригування зумовлене зростанням ефективності post-train після того, як стратегія Agent RL Scaling стала зрілою, а також потребою сценаріїв упровадження Agent у здатності до негайного реагування на інференсному боці.

Який відкритий рейтинг та показники швидкості у MiMo-V2-Flash?

Згідно з офіційним оголошенням Xiaomi від 19 березня 2026 року, MiMo-V2-Flash, який уже відкрито, у глобальному рейтингу відкритих моделей посів друге місце; швидкість інференсу — у 3 рази вища за DeepSeek-V3.2, а показник завершення завдань у флагманській версії MiMo-V2-Pro становить 81%.

Застереження: Інформація на цій сторінці може походити від третіх осіб і не відображає погляди або думки Gate. Вміст, що відображається на цій сторінці, є лише довідковим і не є фінансовою, інвестиційною або юридичною порадою. Gate не гарантує точність або повноту інформації і не несе відповідальності за будь-які збитки, що виникли в результаті використання цієї інформації. Інвестиції у віртуальні активи пов'язані з високим ризиком і піддаються значній ціновій волатильності. Ви можете втратити весь вкладений капітал. Будь ласка, повністю усвідомлюйте відповідні ризики та приймайте обережні рішення, виходячи з вашого фінансового становища та толерантності до ризику. Для отримання детальної інформації, будь ласка, зверніться до Застереження.

Пов'язані статті

Gemini запускає агентську торгівлю для автоматизованого трейдингу з підтримкою ШІ

Криптобіржа Gemini запустила Agentic Trading, що знаменує перший випадок, коли регульована біржа США запропонувала пряму інтеграцію AI-агентів для автоматизованого трейдингу. Платформа дозволяє користувачам підключати Claude, ChatGPT та інші моделі ШІ, щоб автоматизувати торгові стратегії — від простих ордерів до

CryptoFrontier6хв. тому

DeFi United Hits $300M With Consensys, Лубін зобов’язується на 30K ETH

## Consensys та Джозеф Лубін зобов’язуються надати 30,000 ETH DeFi United У понеділок студія розробки Ethereum Consensys і засновник Джозеф Лубін спільно оголосили про внесок у розмірі 30,000 ETH у DeFi United — скоординовані зусилля для покриття збитків від експлойту Kelp DAO, згідно з оголошенням Aave на

CryptoFrontier1год тому

Alphea запускає AI-орієнтований блокчейн рівня 1 із виконанням автономних агентів

Повідомлення Gate News, 27 квітня — Alphea, новий представлений блокчейн рівня 1, створений для інфраструктури ШІ, офіційно представила своє децентралізоване середовище виконання на Гонконгському Web3-фестивалі 2026. Платформа інтегрує виконання, персистентну пам’ять і верифіковані обчислення як

GateNews2год тому

Gate проведе AI Trading Space-раундтейбл 28 квітня: дослідження AI як рушія наступного циклу Web3

Повідомлення Gate News, 27 квітня — Gate проведе пряму дискусію в Space-форматі про AI Trading 28 квітня о 20:00, об’єднавши експертів галузі, щоб з’ясувати, чи глибока інтеграція AI в торгові робочі процеси є справжньою точкою відліку наступного циклу Web3. У межах обговорення буде розглянуто A

GateNews5год тому

Ant Group запустила Ling-2.6-1T: модель із трильйон параметрів, оптимізована для виконання завдань із високою токен-ефективністю

Повідомлення Gate News, 27 квітня — включенняAI від Ant Group випустила Ling-2.6-1T, нову флагманську інструкційну модель трильйон-параметрів у серії Ling. На відміну від моделей міркувань із довгими ланцюгами, Ling-2.6-1T використовує механізм "Швидке мислення", призначений для точного виконання завдань із мінімальним споживанням токенів

GateNews6год тому

Nansen API тепер підтримує протокол Tempo MPP, уможливлюючи оплату для агентів ШІ за кожен виклик

Повідомлення Gate News, 27 квітня — Nansen API тепер підтримує протокол Machine Payments Protocol (MPP), стандарт для автономних платежів машина-машина, що підтримується Tempo та Stripe. Інтеграція дозволяє агентам ШІ здійснювати оплату безпосередньо зі своїх гаманців на основі одного виклику. Функція працює разом із

GateNews6год тому
Прокоментувати
0/400
Немає коментарів