Агентские возможности в полном соответствии с Opus4.6, цена всего 4%: Arcee открывает исходный код Trinity Large Thinking

BlockBeatNews

По данным мониторинга 1M AI News, американская компания-разработчик AI-моделей Arcee выпустила Trinity-Large-Thinking — open-source модель рассуждений, предназначенную для задач Agent на длительных временных горизонтах. Модель использует архитектуру разреженной смеси экспертов (MoE): общее число параметров — 400B, число активируемых параметров — только 13B. Доступ к открытым весам осуществляется через Hugging Face по лицензии Apache 2.0.

В отличие от предшественника Trinity-Large-Preview (только инструкционное дообучение), Trinity-Large-Thinking перед ответом выполняет «мыслительные рассуждения», имеет улучшения по многим показателям: многораундные вызовы инструментов, согласованность длинного контекста и способность следовать инструкциям. Ключевой дизайн-цель — обеспечивать стабильный вывод в циклах Agent на длительном времени.

На бенчмарке агентных возможностей PinchBench, разработанном в Kilo, модель набрала 91.9 и заняла второе место — лишь следом за Opus 4.6 с 93.3; на бенчмарке задач Agent Tau2-Airline она набрала 88.0, что является самым высоким показателем среди всех сравниваемых моделей. Однако результаты на универсальных бенчмарках рассуждений в целом умеренные: GPQA-D — 76.3, что ниже Kimi-K2.5 (86.9) и Opus 4.6 (89.2); MMLU-Pro — 83.4, также находится в хвосте. Согласно официальному описанию Arcee, эта модель в «многих измерениях является самым сильным open-source-моделем за пределами Китая».

Ценообразование Arcee API: $0.90 за миллион token на выходе; по заявлению Arcee, это примерно на 96% дешевле, чем Opus 4.6. Модель одновременно поступила в продажу на платформе маршрутизации AI-моделей OpenRouter; в первые 5 дней ее можно было бесплатно использовать в OpenClaw. С момента публикации предшествующей версии Preview в конце января на OpenRouter она уже обслужила более 3.37 трлн token; это open-source модель №1 по объему использования в США, включенная в OpenClaw, и №4 в мире. Preview продолжит бесплатно предлагаться на OpenRouter.

Отказ от ответственности: Информация на этой странице может поступать от третьих лиц и не отражает взгляды или мнения Gate. Содержание, представленное на этой странице, предназначено исключительно для справки и не является финансовой, инвестиционной или юридической консультацией. Gate не гарантирует точность или полноту информации и не несет ответственности за любые убытки, возникшие от использования этой информации. Инвестиции в виртуальные активы несут высокие риски и подвержены значительной ценовой волатильности. Вы можете потерять весь инвестированный капитал. Пожалуйста, полностью понимайте соответствующие риски и принимайте разумные решения, исходя из собственного финансового положения и толерантности к риску. Для получения подробностей, пожалуйста, обратитесь к Отказу от ответственности.
комментарий
0/400
Нет комментариев