Только что заметил кое-что интересное, о чем большинство людей еще не задумываются. Все уже много лет зациклены на поставках GPU, но тихо, CPU стали настоящим ограничением в инфраструктуре ИИ. И это смещение происходит быстрее, чем большинство осознает.



В прошлом месяце Google и Intel объявили о крупной многолетней сделке специально для устранения этого узкого места с CPU. Сообщение Intel было ясным: ИИ не работает только на GPU — CPU и системная оркестрация теперь являются ограничивающим фактором. Тем временем, цены на серверные CPU выросли примерно на 30% в четвертом квартале прошлого года, что удивительно для зрелого рынка. Время поставки AMD увеличилось с 8 до более чем 10 недель, а некоторые компоненты задерживаются на 6 месяцев. Это не хайп — это реальное давление на поставки.

Ирония жесткая: лаборатории ИИ имеют множество простаивающих GPU, но не могут получить достаточно высокопроизводительных CPU для их запуска. Вместимость TSMC по 3 нм сокращается из-за заказов на GPU, поэтому распределение чипов CPU постоянно перераспределяется. Даже Илон Маск вмешался в игру CPU, заказав Intel разработать кастомные чипы для его проекта Terafab в Техасе. Вот насколько все стало напряженно.

Почему вдруг такое смещение? Потому что задачи агентов полностью отличаются от традиционной инференции. Чат-боты в основном передают вычисления на GPU. Но агенты? Им нужно управлять API, работать с базами данных, выполнять код и координировать результаты — все это CPU-ресурсы. Исследователи Georgia Tech обнаружили, что работа на стороне CPU теперь составляет 50-90% общей задержки в системах агентов. GPU просто сидит в ожидании, пока CPU занимается вызовами инструментов.

Рост размеров контекстных окон тоже не помогает. Модели теперь поддерживают более 1 миллиона токенов, а кеш KV достигает около 200 ГБ — намного больше, чем может вместить один H100. CPU должны управлять этим памятью, поэтому теперь они не только оркестрируют, но и занимаются серьезным управлением данными.

Посмотрите, как реагируют производители. Генеральный директор AMD Лиза Су прямо говорит: задачи агентов возвращают нагрузку на традиционные CPU, и это стимулирует их рост. Выручка дата-центров AMD достигла 5,4 миллиарда долларов в четвертом квартале, увеличившись на 39% по сравнению с прошлым годом, причем EPYC выполняют основную работу. Рыночная доля AMD в серверных CPU превысила 40% впервые. Но у AMD все еще нет такой тесной интеграции CPU-GPU, как у NVIDIA с NVLink.

NVIDIA пошла другим путем. Их процессор Grace имеет всего 72 ядра против 128 у AMD или типичных конфигураций Intel. Вместо гонки за количеством ядер NVIDIA сосредоточилась на сотрудничестве — NVLink C2C увеличивает пропускную способность до 1,8 ТБ/с, позволяя CPU напрямую обращаться к памяти GPU. Они начали продавать Grace как отдельный продукт, а Meta недавно запустила масштабное «чистое развертывание Grace» без привязки к GPU. Это сигнал.

Intel играет обе стороны — продвигает процессоры Xeon в партнерствах с гиперскейлерами и одновременно сотрудничает с SambaNova по гибридным решениям, которые выполняют инференс агентов без GPU. Процесс 18A и дорожная карта Xeon 6 Granite Rapids будут для них критическими.

Вот большая картина: партнерство Amazon с $38B OpenAI явно упоминает о развертывании «десятков миллионов CPU». Это смена старого сценария «сотен тысяч GPU». Bank of America прогнозирует, что рынок CPU может удвоиться с $27B до $60B к 2030 году, почти полностью благодаря ИИ.

Что мы действительно видим — это полная перестройка инфраструктуры. Компании больше не просто масштабируют GPU — они одновременно строят целый слой инфраструктуры оркестрации CPU, специально предназначенной для агентов ИИ. Когда вычислений становится достаточно, эффективность на системном уровне становится ключевым фактором. Следующие победители в ИИ не будут определяться количеством GPU, а тем, кто первым решит проблему CPU-узкого места.
Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
Нет комментариев
  • Закрепить