«Token Нової епохи»: Китайська індустрія штучного інтелекту «Десять питань і відповідей»

Індустрія базових моделей для штучного інтелекту в Китаї переходить на ключовому етапі від «очікувань, що керують попитом» до «попиту, що керує розвитком». У найновішому дослідницькому звіті JPMorgan системно відповіла на десять ключових питань інвесторів щодо цієї галузі, вважаючи, що якість моделей стала головною змінною, яка визначає конфігурацію ринку, а розшарування індустрії прискориться.

Згідно зі звітом, опублікованим JPMorgan 27 березня, у документі зазначено, що китайський ринок ШІ перебуває в явній точці перелому: попит у сценаріях кодування та агентів зростає швидше, а можливості вітчизняних моделей уже наближаються або навіть перевищують рівень провідних американських моделей рік тому; водночас локальне ціноутворення краще відповідає економічній доцільності, і разом ці фактори покращують очікувану віддачу від впровадження.

2026 рік — ключовий рік для того, чи зможуть AI-запити китайських компаній відтворити траєкторію зростання 2025 року в США. Як орієнтир, у Anthropic річна регулярна виручка (ARR) зросла з 1 млрд доларів у грудні 2024 року до 19 млрд доларів у березні 2026 року — приблизно в 19 разів за 15 місяців.

Китайський ринок має умови для дотримання подібного шляху, зокрема в сфері кодування: такі інтернет-гіганти, як Tencent, Alibaba та ByteDance, уже інтегрували відповідні інструменти в наявні екосистеми, переводячи попит із окремих демонстрацій до повномасштабного розгортання. Банк зберігає рекомендації «купувати більше» для Zhipu та MiniMax: цільові ціни — відповідно 800 гонконгських доларів і 1100 гонконгських доларів.

Питання перше: чи зростає попит на AI лінійно, чи вибухає в точці перелому?

Попит керується точкою перелому, а не лінійним зростанням.

Поки якість моделей буде достатньо високою, щоб відкривати реальні сценарії застосування, використання переключиться з лінійного зростання на «висхідну криву» у вигляді вибуху. Найпереконливіший доказ — з американського ринку: річна регулярна виручка (ARR) Anthropic з 1 млрд доларів у грудні 2024 року за якихось 15 місяців злетіла до 19 млрд доларів у березні 2026 року — майже в 19 разів.

Наразі Китай має базу для подібного вибуху: можливості місцевих моделей перевищили рівень провідних американських моделей рік тому, а локальне ціноутворення краще відповідає економічній ефективності саме для китайської економіки. Поєднання цих двох факторів суттєво покращує очікування щодо віддачі від впровадження AI.

У сегменті агентів OpenClaw став важливим каталізатором: сценарії використання переходять із однократної взаємодії до виконання багатокрокових завдань, суттєво підвищуючи кількість token на кожне завдання. Такі інтернет-гіганти, як Tencent, Alibaba та ByteDance, уже інтегрували інструменти, пов’язані з OpenClaw, у наявні екосистеми, що означає еволюцію тренду з «експериментів для розробників» до «повномасштабного розгортання в екосистемі».

Питання друге: ціни на API зростатимуть, падатимуть чи відбуватиметься розшарування?

Ціноутворення не рухатиметься в одному напрямку — розшарування і є головний мотив.

З одного боку, моделі з сильними можливостями формують цінову владу. Якщо певна модель унікально розкриває високоцінні завдання (агентне кодування, довгострокові робочі процеси, надійність рівня enterprise), клієнти готові платити премію, адже віддача піддається кількісній оцінці. З іншого боку, зі зростанням ефективності «хардвару» та алгоритмів собівартість інференсу за одиницю безперервно знижуватиметься, створюючи ціновий тиск на моделі, можливості яких «застигають».

У підсумку формується розшарована структура цін: моделі, що тримаються на передовому рівні, можуть одночасно забезпечувати і зростання обсягу, і зростання цін; моделі, які не оновлюються стабільно, зіткнуться зі зниженням цін — навіть якщо використання все ще зростатиме, маржа прибутку буде менш визначеною.

Питання третє: якщо ціноутворення не є основним полем битви, де тоді зосереджена конкуренція?

Основне поле битви змістилося з ціни за token на можливості моделей.

Це ключова зміна порівняно з минулим роком: у 2025 році фокус на китайському ринку полягав у всеосяжній ціновій війні, а нині в найшвидше зростаючих сценаріях кодування та агентів якість важить значно більше, ніж ціна за одиницю.

У багатокрокових робочих процесах сутність покупки для клієнта — не «дешеві token», а «завершення завдання без проблем». У звіті наведено інтуїтивний математичний приклад: якщо ймовірність успіху одного кроку зростає з 85% до 98%, то для 20-крокового завдання кінцева ймовірність завершення стрибне з 4% до 67%. За цією логікою модель із найнижчою ціною за token може мати найвищу фактичну комплексну собівартість для завершення кожного завдання.

У звіті також зазначено: компанії, що мають сильні передові моделі, можуть легко зайти на нижчі сегменти, але компаніям, які спираються лише на низьку ціну, складно вийти на високі сегменти.

Питання четверте: чому базові великі моделі — це галузь «їжачки проти їжачків»?

Три фактори роблять індустрію надзвичайно жорсткою: технологічні розриви невеликі, цикл ітерацій безкінечний, а моделі монетизації збігаються.

Різниця в можливостях між компаніями базових моделей у Китаї часто менша, ніж очікують інвестори, через що ринок є дуже нестабільним. У цій індустрії «стояння на місці» — це не нейтральний результат, а означає втрату позиції: компанія має безперервно інвестувати та постійно оновлюватися, щоб не відстати.

Тиск на відсів посилюється збігом бізнес-моделей. Зростання виручки та маржинальність прибутку залежать насамперед від сили продукту, а конверсійні витрати лишаються відносно низькими. Це означає, що компанії, які втрачають технологічний імпульс, швидко втратять можливість захисту як у бізнесі, так і у фінансах, а кількість справді надійних компаній у галузі поступово зменшуватиметься.

Питання п’яте: від чого залежить прибутковість?

Ключове питання — чи зможе темп зростання валового прибутку стабільно перевищувати темп зростання витрат на розробку.

Базова економічна модель token-бізнесу чітка: виручка = обсяг використання token × ціна, основні витрати — обчислення для інференсу, а максимальні операційні витрати — пов’язані з тренуванням R&D. Оскільки ефективність моделей і ефективність інференсних чипів продовжують зростати, маржа валового прибутку в передових моделях має поступово підвищуватися.

Однак перспективи операційного прибутку значно складніші. Anthropic — застережливий приклад: навіть коли рівень місячної виручки в лютому 2026 року досяг 14 млрд доларів, компанія в той самий період оголосила новий раунд фінансування на 30 млрд доларів і підкреслила необхідність безперервної передової розробки — висока виручка не означає нормалізації інтенсивності тренування.

Базовий сценарій такий, що Zhipu та MiniMax, як очікується, вийдуть на беззбитковість з 2029 року. У звіті наголошується: важливіший показник для відстеження, ніж конкретний рік прибутковості, це — стабільна траєкторія зростання використання, а також стабільне поліпшення одиничної економіки.

Питання шосте: як інвесторам відстежувати силу моделей?

Потрібно поєднати три виміри: ціну token, обсяг використання та сторонні оцінки — одного показника недостатньо, щоб пояснити картину.

  • Ціна token: це найважливіший показник, бо він є оперативним відображенням компанією її позиціонування на ринку власного продукту. Різниця в ціні відносно найкращих моделей уже перетворюється на хороший проксі-показник фактичної конкурентоздатності моделей.

  • Обсяг використання token: фактичне споживання відображає реальний вибір користувачів і розробників. Такі сторонні API-агрегатори, як OpenRouter, можуть слугувати орієнтиром; особливо потрібно стежити за зростанням агентних робочих навантажень, адже в цьому типі навантажень token на завдання витрачається значно більше, ніж у простих робочих процесах.

  • Сторонні оцінки: Artificial Analysis забезпечує структуровану оцінку, LMArena відображає сліпі преференції реальних користувачів; обидва підходи доповнюють один одного, формуючи більш повний зовнішній погляд.

Питання сьоме: інтернет-гіганти масово заходять у B-енд — куди подітися незалежним компаніям моделей?

Межі конкуренції зближуються, і врешті-решт все зводиться до змагання за можливості моделей.

Alibaba чітко визначила хмару та AI як стратегічні пріоритети, глибоко прив’язавши розробку моделей до корпоративних робочих процесів; продукти агентів, що їх запускає Tencent, охопили всі сценарії — від індивідуальних до розробників і підприємств; OpenAI також змістив комерційний фокус на корпоративні продукти та агентне кодування. Напрям у топ-компаній узгоджений: AI еволюціонує від «функцій для споживацького сегмента» до «інструменту, який напряму створює корпоративні доходи».

У цьому контексті незалежним компаніям моделей лише з «нейтральним щодо хмари» ярликом недостатньо, щоб сформувати рів. Інтернет-гіганти також не можуть повністю перекрити нестачу можливостей моделей лише за рахунок переваги екосистемного трафіку. Коли корпоративні клієнти впроваджують AI, ядро купівлі — все ще якість моделі: сильніші можливості для кодування та інференсу, вища надійність виконання робочих процесів.

Питання восьме: які чинники визначають, чи компанія виживе?

Таланти — перші, обчислювальні потужності — другі, організаційне виконання — треті; усі три необхідні.

  • Топові дослідницькі таланти: це все ще індустрія, керована дослідженнями. Сама здатність керівництва робити правильні технічні оцінки є елементом конкуренції; чи зможе менеджмент ухвалювати правильні рішення щодо напрямів досліджень напряму впливає на технічну траєкторію компанії.

  • Обчислювальні потужності та капітал: передові витрати на тренування високі, а економіка інференсу залежить від якості інфраструктури. Слабка спроможність отримувати обчислювальні потужності — структурний недолік: це впливає не лише на ефективність тренування моделей, а й знижує здатність реагувати на попит за розумною вартістю.

  • Організаційна здатність виконувати: на ринку з швидкими ітераціями вміння перетворювати результати досліджень на продукт, продукт на використання, а використання на монетизацію майже так само важливе, як і самі моделі.

Питання дев’яте: якщо всі вдосконалюються, чи зрештою моделі стануть схожими?

Загальна сила зблизиться, але не зрівняється, і ринок не сформує модель «переможець забирає все».

Різні компанії відрізняються в виборі архітектури, тренувальних даних, акцентах на продукті та технічному шляху; ці відмінності й надалі створюватимуть різні переваги можливостей. У звіті вважають, що в ринку, який ще швидко розширюється, кілька компаній можуть одночасно зростати, навіть якщо є певне накладання можливостей: на цьому етапі значення розширення всього ринку значно важливіше, ніж занадто ранні побоювання щодо «товаризації».

У довгій перспективі більш реалістичним ринковим сценарієм є не «одна компанія домінує, а решта виходить з гри», а «залишається кілька справді сильних компаній», у кожної з них — сфери переваг, і вони конкурують на ринку, який здатен підтримувати кількох переможців. Оскільки AI розширюється з інструментів продуктивності до сценаріїв для споживчого сегмента, відмінності в індивідуальних смаках, стилях і вподобаннях лише посилюватимуть цю багатомірність.

Питання десяте: як поєднати єдине розуміння щодо відкритого / закритого коду, ітерацій моделей та ризиків глобальної експансії?

Ітерації — обов’язковий пункт, відкритий / закритий код — питання стратегічного вибору, а ключовий ризик глобальної експансії — у обчислювальних потужностях і комплаєнсі.

Щодо ітерацій моделей: очікуваний темп — приблизно раз на рік випускати покоління флагманських моделей (наприклад, GLM 4.7 до GLM 5, серії MiniMax M2 до M3), а між ними — невеликі оновлення, які підсилюються навчанням із підкріпленням. Зупинка ітерацій означає втрату конкурентної позиції.

Щодо відкритого / закритого коду: у звіті вважають, що відповідь не «або-або». Закриті моделі мають сильніший комерційний оборонний ефект і знижують ризик декомедiації; відкритий код допомагає будувати екосистему, підвищувати рівень прийняття та прискорювати технологічний зворотний зв’язок. Тому більшість китайських компаній моделей зрештою застосують змішану стратегію: закриті найновіші й найсильніші моделі, а відкритим — частину інших версій.

Щодо глобальної експансії: найбільший ризик усе ще — здатність отримувати обчислювальні потужності. Тренування й інференс сильно залежать від високопродуктивних чипів; посилення експортних обмежень одночасно сповільнить темпи прогресу моделей і погіршить конкурентоспроможність за витратами. Другий ризик — дані та безпекові вимоги комплаєнсу: якщо розгортання моделей, сервіс для користувачів і зберігання даних можна реалізувати із локалізацією за кордоном, то проблеми транскордонної передачі даних відносно контрольовані; однак локальні правила конфіденційності та визначення дозволів на доступ до даних пов’язаних із Китаєм сутностей все ще є джерелом невизначеності.

Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Закріпити