Недавно в мире ИИ снова произошел бум — одна из ведущих лабораторий ИИ сразу выпустила два серьезных продукта: стандартную версию V3.2 и специализированную версию для соревнований Speciale.
Сначала поговорим о Speciale, этом "короле экзаменов": он прямо-таки сметает золотые медали на четырех крупнейших международных соревнованиях, таких как IMO, ICPC и других. На HMMT в феврале 2025 года он набрал 99,2 балла, что означает, что он превосходит 99% участников. Программирование еще более впечатляющее, рейтинг на CodeForces 2701 — что это вообще значит? Это практически уровень лучших инженеров.
Стандартная версия V3.2 тоже не сидела без дела: благодаря архитектуре разреженного внимания DSA скорость вывода увеличилась на 30%, а объем выходного контента удалось сократить на 40%. В тестировании на базе агентного теста Tool-Decathlon без специальной подготовки она достигает 85% производительности закрытых крупных моделей.
На данный момент веб-версия, приложение и API уже переключены на официальную версию V3.2. Если вы хотите попробовать Speciale, вам нужно использовать их временно открытый API-интерфейс — в конце концов, эта штука слишком мощная, возможно, она все еще находится на стадии наблюдения.
Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
Недавно в мире ИИ снова произошел бум — одна из ведущих лабораторий ИИ сразу выпустила два серьезных продукта: стандартную версию V3.2 и специализированную версию для соревнований Speciale.
Сначала поговорим о Speciale, этом "короле экзаменов": он прямо-таки сметает золотые медали на четырех крупнейших международных соревнованиях, таких как IMO, ICPC и других. На HMMT в феврале 2025 года он набрал 99,2 балла, что означает, что он превосходит 99% участников. Программирование еще более впечатляющее, рейтинг на CodeForces 2701 — что это вообще значит? Это практически уровень лучших инженеров.
Стандартная версия V3.2 тоже не сидела без дела: благодаря архитектуре разреженного внимания DSA скорость вывода увеличилась на 30%, а объем выходного контента удалось сократить на 40%. В тестировании на базе агентного теста Tool-Decathlon без специальной подготовки она достигает 85% производительности закрытых крупных моделей.
На данный момент веб-версия, приложение и API уже переключены на официальную версию V3.2. Если вы хотите попробовать Speciale, вам нужно использовать их временно открытый API-интерфейс — в конце концов, эта штука слишком мощная, возможно, она все еще находится на стадии наблюдения.