Фьючерсы
Доступ к сотням фьючерсов
TradFi
Золото
Одна платформа мировых активов
Опционы
Hot
Торги опционами Vanilla в европейском стиле
Единый счет
Увеличьте эффективность вашего капитала
Демо-торговля
Введение в торговлю фьючерсами
Подготовьтесь к торговле фьючерсами
Фьючерсные события
Получайте награды в событиях
Демо-торговля
Используйте виртуальные средства для торговли без риска
Запуск
CandyDrop
Собирайте конфеты, чтобы заработать аирдропы
Launchpool
Быстрый стейкинг, заработайте потенциальные новые токены
HODLer Airdrop
Удерживайте GT и получайте огромные аирдропы бесплатно
Pre-IPOs
Откройте полный доступ к глобальным IPO акций
Alpha Points
Торгуйте и получайте аирдропы
Фьючерсные баллы
Зарабатывайте баллы и получайте награды аирдропа
Инвестиции
Simple Earn
Зарабатывайте проценты с помощью неиспользуемых токенов
Автоинвест.
Автоинвестиции на регулярной основе.
Бивалютные инвестиции
Доход от волатильности рынка
Мягкий стейкинг
Получайте вознаграждения с помощью гибкого стейкинга
Криптозаймы
0 Fees
Заложите одну криптовалюту, чтобы занять другую
Центр кредитования
Единый центр кредитования
Рекламные акции
AI
Gate AI
Ваш универсальный AI-ассистент для любых задач
Gate AI Bot
Используйте Gate AI прямо в вашем социальном приложении
GateClaw
Gate Синий Лобстер — готов к использованию
Gate for AI Agent
AI-инфраструктура: Gate MCP, Skills и CLI
Gate Skills Hub
Более 10 тыс навыков
От офиса до трейдинга: единая база навыков для эффективного использования ИИ
GateRouter
Умный выбор из более чем 30 моделей ИИ, без дополнительных затрат (0%)
Только что заметил кое-что интересное, о чем большинство людей еще не задумываются. Все уже много лет зациклены на поставках GPU, но тихо, CPU стали настоящим ограничением в инфраструктуре ИИ. И это смещение происходит быстрее, чем большинство осознает.
В прошлом месяце Google и Intel объявили о крупной многолетней сделке специально для устранения этого узкого места с CPU. Сообщение Intel было ясным: ИИ не работает только на GPU — CPU и системная оркестрация теперь являются ограничивающим фактором. Тем временем, цены на серверные CPU выросли примерно на 30% в четвертом квартале прошлого года, что удивительно для зрелого рынка. Время поставки AMD увеличилось с 8 до более чем 10 недель, а некоторые компоненты задерживаются на 6 месяцев. Это не хайп — это реальное давление на поставки.
Ирония жесткая: лаборатории ИИ имеют множество простаивающих GPU, но не могут получить достаточно высокопроизводительных CPU для их запуска. Вместимость TSMC по 3 нм сокращается из-за заказов на GPU, поэтому распределение чипов CPU постоянно перераспределяется. Даже Илон Маск вмешался в игру CPU, заказав Intel разработать кастомные чипы для его проекта Terafab в Техасе. Вот насколько все стало напряженно.
Почему вдруг такое смещение? Потому что задачи агентов полностью отличаются от традиционной инференции. Чат-боты в основном передают вычисления на GPU. Но агенты? Им нужно управлять API, работать с базами данных, выполнять код и координировать результаты — все это CPU-ресурсы. Исследователи Georgia Tech обнаружили, что работа на стороне CPU теперь составляет 50-90% общей задержки в системах агентов. GPU просто сидит в ожидании, пока CPU занимается вызовами инструментов.
Рост размеров контекстных окон тоже не помогает. Модели теперь поддерживают более 1 миллиона токенов, а кеш KV достигает около 200 ГБ — намного больше, чем может вместить один H100. CPU должны управлять этим памятью, поэтому теперь они не только оркестрируют, но и занимаются серьезным управлением данными.
Посмотрите, как реагируют производители. Генеральный директор AMD Лиза Су прямо говорит: задачи агентов возвращают нагрузку на традиционные CPU, и это стимулирует их рост. Выручка дата-центров AMD достигла 5,4 миллиарда долларов в четвертом квартале, увеличившись на 39% по сравнению с прошлым годом, причем EPYC выполняют основную работу. Рыночная доля AMD в серверных CPU превысила 40% впервые. Но у AMD все еще нет такой тесной интеграции CPU-GPU, как у NVIDIA с NVLink.
NVIDIA пошла другим путем. Их процессор Grace имеет всего 72 ядра против 128 у AMD или типичных конфигураций Intel. Вместо гонки за количеством ядер NVIDIA сосредоточилась на сотрудничестве — NVLink C2C увеличивает пропускную способность до 1,8 ТБ/с, позволяя CPU напрямую обращаться к памяти GPU. Они начали продавать Grace как отдельный продукт, а Meta недавно запустила масштабное «чистое развертывание Grace» без привязки к GPU. Это сигнал.
Intel играет обе стороны — продвигает процессоры Xeon в партнерствах с гиперскейлерами и одновременно сотрудничает с SambaNova по гибридным решениям, которые выполняют инференс агентов без GPU. Процесс 18A и дорожная карта Xeon 6 Granite Rapids будут для них критическими.
Вот большая картина: партнерство Amazon с $38B OpenAI явно упоминает о развертывании «десятков миллионов CPU». Это смена старого сценария «сотен тысяч GPU». Bank of America прогнозирует, что рынок CPU может удвоиться с $27B до $60B к 2030 году, почти полностью благодаря ИИ.
Что мы действительно видим — это полная перестройка инфраструктуры. Компании больше не просто масштабируют GPU — они одновременно строят целый слой инфраструктуры оркестрации CPU, специально предназначенной для агентов ИИ. Когда вычислений становится достаточно, эффективность на системном уровне становится ключевым фактором. Следующие победители в ИИ не будут определяться количеством GPU, а тем, кто первым решит проблему CPU-узкого места.