Фьючерсы
Доступ к сотням фьючерсов
TradFi
Золото
Одна платформа мировых активов
Опционы
Hot
Торги опционами Vanilla в европейском стиле
Единый счет
Увеличьте эффективность вашего капитала
Демо-торговля
Введение в торговлю фьючерсами
Подготовьтесь к торговле фьючерсами
Фьючерсные события
Получайте награды в событиях
Демо-торговля
Используйте виртуальные средства для торговли без риска
Запуск
CandyDrop
Собирайте конфеты, чтобы заработать аирдропы
Launchpool
Быстрый стейкинг, заработайте потенциальные новые токены
HODLer Airdrop
Удерживайте GT и получайте огромные аирдропы бесплатно
Pre-IPOs
Откройте полный доступ к глобальным IPO акций
Alpha Points
Торгуйте и получайте аирдропы
Фьючерсные баллы
Зарабатывайте баллы и получайте награды аирдропа
Инвестиции
Simple Earn
Зарабатывайте проценты с помощью неиспользуемых токенов
Автоинвест.
Автоинвестиции на регулярной основе.
Бивалютные инвестиции
Доход от волатильности рынка
Мягкий стейкинг
Получайте вознаграждения с помощью гибкого стейкинга
Криптозаймы
0 Fees
Заложите одну криптовалюту, чтобы занять другую
Центр кредитования
Единый центр кредитования
Рекламные акции
AI
Gate AI
Ваш универсальный AI-ассистент для любых задач
Gate AI Bot
Используйте Gate AI прямо в вашем социальном приложении
GateClaw
Gate Синий Лобстер — готов к использованию
Gate for AI Agent
AI-инфраструктура: Gate MCP, Skills и CLI
Gate Skills Hub
Более 10 тыс навыков
От офиса до трейдинга: единая база навыков для эффективного использования ИИ
GateRouter
Умный выбор из более чем 30 моделей ИИ, без дополнительных затрат (0%)
Недавно популярный AI-чип Cerebras, который подает заявку на IPO, стал звездой Кремниевой долины.
Его чип в сценариях работы с малыми моделями достигает скорости вывода до 20 раз выше H100; а при работе с очень крупными моделями (например, 400 миллиардов параметров) скорость отклика системы Cerebras CS-3 для одного пользователя составляет примерно в 2,4 раза больше, чем у B200.
Так как же Cerebras удается это делать?
Станет ли он убийцей Nvidia?
Нам нужно начать с сути эволюции вычислительных мощностей.
Эволюция AI-вычислений сейчас смещается с «самой мощности» к «коммуникациям и системной архитектуре».
На этом пути развития Cerebras Systems предлагает совершенно иной ответ: не оптимизация распределенных систем, а максимально устранение распределенности.
一、Два подхода: устранение коммуникаций vs оптимизация коммуникаций
В настоящее время суть AI-вычислений делится на две архитектурные философии: одна — это путь, представленный Nvidia:
Мультичипы (GPU), высокоскоростное соединение (NVLink / CPO), масштабирование по горизонтали (scale-out)
Другая — путь Cerebras: достижение предела на одном чипе (wafer-scale)
Внутрисхемная сеть заменяет межузловую коммуникацию, масштабирование по вертикали (scale-up)
Ключевое отличие — одна решает «как соединить больше чипов», другая — «как не нужно соединять».
二、Почему эта идея сейчас стала возможной
Wafer-scale — не новая концепция, её пытались реализовать еще в 80-х, но в 90-х она потерпела коммерческий провал. Причины:
Низкий уровень выхода годных чипов
Отсутствие механизмов отказоустойчивости
Недостаточная поддержка программного обеспечения
В отрасли сформировалось понимание: маленькие die + высокая выходная способность + распределенность.
Прорыв Cerebras заключается в одновременном выполнении трех условий:
1) Инженерное решение механизмов отказоустойчивости
2) Созревание внутри-микросхемных сетей
3) Соответствие AI-нагрузкам (высокая параллельность, сильная синхронизация, коммуникации как главный фактор)
По сути, произошел переход от «идеального железа» к «отказоустойчивой системе».
三、Сравнение производительности: предел одного узла vs расширение системы
На уровне коммуникаций два подхода очевидно различаются:
1) Внутрисхемная коммуникация
Cerebras: полностью внутри чипа → минимальная задержка, минимальное энергопотребление
CPO: все еще есть оптическое преобразование → эффективность на одном узле лучше у Cerebras
2) Расширение системы
Cerebras: при межчиповой коммуникации → возвращение к проблемам связи
CPO: пропускная способность может масштабироваться без ограничений → более высокая системная производительность
3) Структура энергопотребления
Cerebras: очень высокий расход энергии на один чип, но коммуникации очень экономичны
GPU + CPO: контроль за потреблением на одном узле, баланс системной эффективности
Вывод очевиден:
Cerebras выигрывает в «пределе одного устройства»,
CPO — в «масштабируемости системы».
四、Применение: кому стоит использовать Cerebras
Критерии выбора можно свести к трем вопросам:
1) Является ли коммуникация узким местом?
2) Можно ли сосредоточить задачу?
3) Структура системы — регулярна?
Поэтому он особенно подходит для обучения больших моделей (dense models), работы с очень длинным контекстом и некоторых задач HPC (PDE, гидродинамика и т.п.).
Общие черты этих задач — сильная связность + высокая синхронизация + высокая пропускная способность.
Некоторые сценарии — для inference больших моделей (низкая параллельность), графовые вычисления (при сложной структуре эффективность снижается).
Не подходит для CPU (универсальные вычисления), высокопараллельных inference, мобильных/краевых чипов, систем реального времени.
Общие черты таких систем — нерегулярность, высокая параллельность, низкая задержка.
五、Будет ли это мейнстримом?
Несмотря на сильные стороны Cerebras в определенных сценариях, он вряд ли станет основным решением по причине:
1) Физические ограничения: плотность мощности; задержки сигналов — отказоустойчивость не решает эти проблемы
2) Экономическая эффективность: более высокая выходная способность у маленьких die; гибкость chiplet
3) Индустриальный путь: TSMC и другие ориентируются на модульность, мультизадачность и повторное использование компонентов, а не на сверхбольшие монолиты
4) Изменения в спросе: доля inference значительно выше, чем у обучения; мультизадачность и высокая параллельность становятся нормой
六、Значение Cerebras
Говоря не столько о размере wafer-scale как о важной тенденции, сколько о философии отказоустойчивого проектирования, которая будет широко внедряться.
В будущем возможны chiplet-уровень отказоустойчивости и обходные решения на уровне упаковки.
Ключевое изменение — отдельное железо уже не обязательно должно быть идеально, система берет на себя роль резервного копирования.
Возвращаясь к первоначальному вопросу: станет ли Cerebras «убийцей» Nvidia?
Ответ уже очевиден.
Он действительно затронул слабое место GPU — коммуникации.
Но индустрия не выбирает между «или-или», а использует сразу несколько технологических прорывов: более мощные межсоединения, меньшие энергозатраты на коммуникации, более высокая системная эффективность.
Поэтому более точный вывод — Cerebras не убийца Nvidia, а лучший пример для подражания для Nvidia и всех производителей чипов.
Отказ от ответственности: я владею активами, упомянутыми в статье, мои взгляды субъективны, это не инвестиционный совет, риски очень высоки, входить нужно с крайней осторожностью.
(Рисунок: один чип Cerebras)