Китайский мини Max, снова бросает вызов глобальной генеративной войне с помощью AI модели 'M2.1'

TechubNews

Китайская стартап-компания в сфере искусственного интеллекта MiniMax представила новую модель ИИ M2.1, вновь бросив вызов глобальной конкуренции в области генеративного ИИ. Эта модель значительно усиливает разнообразие языков программирования и способности к адаптации к реальным рабочим условиям, демонстрируя улучшенные характеристики не только в области помощи с кодом, но и в написании документов и ведении диалогов.

Выпущенная версия M2.1 значительно улучшила понимание и точность генерации различных языков программирования благодаря обновлению производительности по сравнению с предыдущей моделью M2. Поддерживаемые языки были расширены до Rust, Java, Go, C++, Kotlin, Objective-C, TypeScript, JavaScript и других. Также были получены значительные улучшения в оценках способности дизайна пользовательского интерфейса и эстетики на платформах Web, Android и iOS.

Особенно выделяется то, что M2.1 не только усиливает правильность выполнения простого кода, но и улучшает его способность интерпретировать и следовать сложным задачам или детальным инструкциям, что позволяет создать более соответствующий реальной офисной среде ИИ. MiniMax в связи с этим улучшил диалоговые возможности модели и способности к написанию документов, и пояснил, что она демонстрирует отличные результаты в широком диапазоне от повседневного общения до написания технической документации и структурированных ответов.

Соучредитель и генеральный директор открытой платформы AI-агентов Kilo Code Скотт Брейтенотер заявил: «В ходе первоначального тестирования M2.1 продемонстрировал выдающиеся результаты на протяжении всего процесса разработки, включая проектирование архитектуры, компоновку кода, рецензирование и развертывание» и оценил, что модель одновременно соответствует соотношению цена-качество и высокому уровню производительности.

Эта модель также оценивается с помощью нового бенчмарка под названием VIBE (Vision and Interactive Benchmark for Execution). VIBE основан на пяти ключевых областях: веб, моделирование, Android, iOS, разработка бэкенда, и проводит комплексную оценку взаимодействующей логики и визуальных элементов сгенерированных результатов, используя агентный язык верификации. По информации от MiniMax, M2.1 набрала в этом бенчмарке в среднем 88.6 балла, при этом в области веб и Android были достигнуты отличные результаты в 91.5 и 89.7 балла соответственно.

M2.1 также была сравнена по производительности с основными AI моделями. В результате оценки наравне с основными моделями таких крупных компаний, как Anthropic, Google, OpenAI, DeepSeek, M2.1 также продемонстрировала мощные способности к решению проблем в сложных бенчмарках, таких как “Последний экзамен человечества” и “Toolathon”. Особенно в проекте HLE без инструментов она получила 22.0 балла, а в综合测试 MMLU(Pro) в области гуманитарных, научных и технических дисциплин получила 88 баллов, сравнявшись с топовыми AI моделями.

M2.1 в настоящее время доступен для загрузки через собственное API MiniMax или Hugging Face, а представитель компании, обслуживающий MiniMax, также работает на основе M2.1. Выпуск этой модели демонстрирует ускоренное развитие поддержки многоязычного кодирования и рынка AI-агентов, а также указывает на то, что универсальность и конкурентоспособность генеративного ИИ, происходящего из Китая, продолжают расширяться.

Посмотреть Оригинал
Отказ от ответственности: Информация на этой странице может поступать от третьих лиц и не отражает взгляды или мнения Gate. Содержание, представленное на этой странице, предназначено исключительно для справки и не является финансовой, инвестиционной или юридической консультацией. Gate не гарантирует точность или полноту информации и не несет ответственности за любые убытки, возникшие от использования этой информации. Инвестиции в виртуальные активы несут высокие риски и подвержены значительной ценовой волатильности. Вы можете потерять весь инвестированный капитал. Пожалуйста, полностью понимайте соответствующие риски и принимайте разумные решения, исходя из собственного финансового положения и толерантности к риску. Для получения подробностей, пожалуйста, обратитесь к Отказу от ответственности.
комментарий
0/400
Нет комментариев