中国ミニマックスは、AIモデル'M2.1'を使用して再び世界の生成戦争に挑戦します

TechubNews

中国の人工知能スタートアップMiniMaxは、全く新しいAIモデルM2.1を発表し、再び世界の生成AI競争に挑戦します。このモデルは、プログラミング言語の多様性と実際の作業環境への対応能力を大幅に強化し、コード補助だけでなく、文書作成や対話応答においても全体的な性能向上を示しています。

今回発表されたM2.1は、前世代モデルM2の性能向上を超えることで、様々なプログラミング言語の理解度と生成精度を大幅に向上させました。サポートされる言語はRust、Java、Go、C++、Kotlin、Objective-C、TypeScript、JavaScriptなどに拡大され、Web、Android、iOSプラットフォームにおけるユーザーインターフェースデザインと美学構成能力も顕著に改善された評価を受けています。

特に、M2.1は単純なコード実行の正確性を強化するだけでなく、複雑なタスク指示や詳細なガイドラインを解釈し従う能力も向上させ、実際のオフィス環境により適したAIを構築しています。MiniMaxはこれにより、モデルの対話能力と文書作成能力を向上させ、日常の対話から技術文書の作成および構造化された応答に至るまでの幅広い範囲で優れた性能を発揮することを示しています。

AI代理オープンプラットフォームKilo Codeの共同創設者兼CEOスコット・ブレイテンオザーは次のように述べています。「初期テストでは、M2.1はアーキテクチャ設計、コード編成、レビュー、デプロイなど、全体の開発プロセスで非常に優れた成果を示しました。」また、このモデルはコスト効率と高レベルのパフォーマンスを同時に満たしていると評価しています。

このモデルは、VIBE(Executionのための視覚およびインタラクティブベンチマーク)と呼ばれる新しいベンチマーク指標を使用して評価されます。VIBEは、Web、シミュレーション、Android、iOS、バックエンド開発の5つのコア分野に基づいて構築され、エージェントベースの検証言語を通じて生成結果のインタラクションロジックと視覚要素を総合的に判断します。MiniMaxによると、M2.1はこのベンチマークテストで平均88.6ポイントを獲得し、その中でWebとAndroid分野ではそれぞれ91.5ポイントと89.7ポイントという優れた成績を収めました。

M2.1は主流のAIモデルとも性能比較が行われました。Anthropic、Google、OpenAI、DeepSeekなどの主要メーカーの主力モデルと並列評価された結果、M2.1は「Humanity’s Last Exam」や「Toolathon」といった高難易度のベンチマークテストでも強力な問題解決能力を示しました。特に、HLE w/o Toolsプロジェクトで22.0点を獲得し、MMLU(Pro)/人文・科学・技術分野の総合テストで88点を獲得し、トップAIモデル群と肩を並べました。

M2.1は現在、MiniMax独自のAPIまたはHugging Faceを通じてダウンロード可能であり、MiniMaxの代理を務める会社の代表もM2.1を基に運営されています。このモデルのリリースは、多言語コーディングサポートとAIエージェント市場の急速な進化を示しており、中国発の生成AIの汎用性と競争力が引き続き拡大していることを示唆しています。

原文表示
免責事項:このページの情報は第三者から提供される場合があり、Gateの見解または意見を代表するものではありません。このページに表示される内容は参考情報のみであり、いかなる金融、投資、または法律上の助言を構成するものではありません。Gateは情報の正確性または完全性を保証せず、当該情報の利用に起因するいかなる損失についても責任を負いません。仮想資産への投資は高いリスクを伴い、大きな価格変動の影響を受けます。投資元本の全額を失う可能性があります。関連するリスクを十分に理解したうえで、ご自身の財務状況およびリスク許容度に基づき慎重に判断してください。詳細は免責事項をご参照ください。
コメント
0/400
コメントなし