* LLM サプライヤーは「パイプ」になりたくない: API のみを提供すると、ユーザーには気づかれません。ユーザーは今日 Claude 4.5 を使用し、明日 GPT 5.1 または GLM-4.6 に切り替える可能性があり、モデルサプライヤーはより安価な計算能力に置き換えられる可能性があります。「パイプ化」されないためには、彼らはクライアント(本体)として参入し、ユーザーを自社のアプリ内に囲い込む必要があります。 * クライアントは「首を絞められる」のを恐れている:いわゆる「偽装」に対する不安です。コアの脳が他の人の手に握られている場合、いつ供給を断たれたり、価格が上がったりするかわかりません。そのため、アプリケーションを作る側も自分でモデルを作成し、脳を持とうとしています。 * ツール提供者は「隠れ化」を恐れている:例えば、もし地元の生活推薦プラットフォームが MCP ツールに変わり、ユーザーが直接 AI と対話して情報を調べるようになると、そのプラットフォームは完全に基盤の API サービスプロバイダーになってしまい、元々のインターフェースの価値や広告収益は直接崩壊します。そこで彼らは納得せず、自分たちのアプリに無理やり AI 機能を詰め込もうとし、ユーザーを引き留めようとしています。
AIの二つの道:クラウドエントリ競争、それともユーザー側のネイティブアプリ?
最近、アリババが通義千問アプリを発表し、C端アプリ戦争に正式に参入しました。サム・アルトマンは以前から「スーパアプリ」に対する執着を何度も表明しており、ChatGPTにさまざまなソーシャル機能を次々と追加しています。
大手企業のストーリーでは、未来のAIアプリは現在のインターネットのスーパープラットフォームのコピーであるかのように思われている——唯一の入口となり、様々な機能を集約する。
しかし、AIアプリケーションの未来は、本当にこの道に収束するのでしょうか?他に可能な道はあるのでしょうか?
一般的なAIチャットアプリから目を移して、CursorやWindsurfなどのプログラミングツールを見てみると、さまざまなMCPツールを統合することで、AIネイティブアプリの全く異なる脈動を感じることができるかもしれません。
消えた堀と全員の不安感
現在のAIアプリケーションエコシステムを生物体に例えると、三つの役割に分解できます:
* Brain(LLMモデルプロバイダー):推論、意思決定、および基礎知識を提供します。
* 身体(クライアント提供者): ユーザーインターフェース(UI/GUI)とコンテキスト環境(Context)、および記憶を提供します。
* 手足(ツールサービス提供者): 検索、カレンダー、予約、支払いなどの具体的な能力を提供する MCP ツール。
理想的な状態では、クライアント(身体)が脳と手足をつなぎ、ユーザーの問題を解決します。
インターネット時代において、アプリケーションの壁は二つの要素から生じています:インターフェース(UI)とインターフェース(API)。ユーザーは特定のインターフェースを通じて特定のサービスを完了することしかできません。しかし、ニーズが自然言語で表現できるようになると、プロンプトは新しいインターフェースとなり、APIの壁も緩んでいきます。アプリケーション間の「境界」が不安定になり始めています。
これにより、エコシステム内のすべての役割が極度に安全感を欠くようになります:
* LLM サプライヤーは「パイプ」になりたくない: API のみを提供すると、ユーザーには気づかれません。ユーザーは今日 Claude 4.5 を使用し、明日 GPT 5.1 または GLM-4.6 に切り替える可能性があり、モデルサプライヤーはより安価な計算能力に置き換えられる可能性があります。「パイプ化」されないためには、彼らはクライアント(本体)として参入し、ユーザーを自社のアプリ内に囲い込む必要があります。
* クライアントは「首を絞められる」のを恐れている:いわゆる「偽装」に対する不安です。コアの脳が他の人の手に握られている場合、いつ供給を断たれたり、価格が上がったりするかわかりません。そのため、アプリケーションを作る側も自分でモデルを作成し、脳を持とうとしています。
* ツール提供者は「隠れ化」を恐れている:例えば、もし地元の生活推薦プラットフォームが MCP ツールに変わり、ユーザーが直接 AI と対話して情報を調べるようになると、そのプラットフォームは完全に基盤の API サービスプロバイダーになってしまい、元々のインターフェースの価値や広告収益は直接崩壊します。そこで彼らは納得せず、自分たちのアプリに無理やり AI 機能を詰め込もうとし、ユーザーを引き留めようとしています。
この「全員不安」の結果が、現在の混乱を引き起こしています:皆がフルスタックを行い、脳、体、手足を完全にコントロールしようとしています。
パス1:クラウドリヴァイアサン(スーパーエントランス)
この種の不安を解消するために、大手企業が提示する解決策は、彼らの慣性思考に非常に合致しています:インターネットのスーパアプリの物語を再現することです。
モデルメーカーの観点から見ると、脳と手足の組み立てはクライアント側で行わない方が良い。なぜなら、その場合、コントロールがユーザーの手に渡ってしまうからだ。彼らはクライアントを「スリムクライアント」モードに戻したいと考えており、音声またはテキストの指示を受け取る能力だけを残したいと望んでいる。
このアーキテクチャでは:
クラウド上の脳:意思決定と推論は完全にベンダーによって制御される。
手足がクラウドに:Function CallingまたはPluginを通じて大手企業のバックエンドに接続します。
クラウド上の記憶:ユーザーのデータ、好み、履歴がすべてアップロードされます。
これにより、スーパーアプリのロジックを完璧に再現でき、インターネットのスーパーアプリよりも恐ろしいものになります。なぜなら、インターネット時代において、スーパーアプリはトラフィックを独占していましたが、サービス間のデータはある程度隔離されていました。しかし、「AIスーパーアプリ」では、メーカーは入口を掌握するだけでなく、モデルを通じてすべての中間決定ロジックを掌握しています。
これは完璧な「クラウドリヴァイアサン」で、非常に効率的ですが、このシステム内のユーザーには、プライバシーや選択権がまったくなく、ただアルゴリズムの餌食となる存在です。
パス2:AIネイティブアプリケーション——ユーザー側の統合
しかし、もう一つの可能性もあります。この兆候はプログラミングの分野で非常に明らかになっています。
現在のAIエディタ(IDE)を見てみましょう:主体はユーザー側にあり、コードベース(Codebase)はローカルにあり、すべてのビジネスロジックとコンテキストはローカルにあります。
脳はプラグイン可能です:IDE内で異なるモデルを設定できます。たとえIDEが設定をサポートしていなくても、インターフェースプロキシを追加することで解決できます。
手と足は標準化されています:MCPのようなプロトコルの登場により、データベース、Git、端末などのツールが標準的なレゴブロックになりました。
このアーキテクチャでは、アプリケーションは大企業がユーザーを囲い込むための壁ではなく、ユーザーに装着される「外骨格」です。
このモードでは、統合(Integration)はクライアント側で行われます。アプリケーションはユーザーのローカルデータ(Context)を整理し、必要に応じてクラウドまたはローカルの「脳」を呼び出して思考し、標準化された「手足」に実行を指示します。
コアデータとロジックはユーザーの側に残っています。少なくとも、あなたのデータはすべて同じベンダーの手に渡ることはありません;少なくとも、あるモデルが鈍くなったとき、より賢い頭脳に切り替えることができます。
もちろん、この道は平坦ではなく、最大の課題はインフラの欠如です。もしスーパー企業がクラウド上でアイデンティティ認証(Auth)を統一していなければ、クライアント側でさまざまなツールサービスのアイデンティティや支払いを通じて持続可能なビジネスモデルを構築することは大きな課題であり、現時点では明確な道筋も見えていません。
しかし、私は暗号分野の非中央集権ID (DID)と決済ネットワークが、ここで重要な役割を果たし、この非中央集権的なAI協力に信頼と決済の基盤を提供できると信じています。このトピックについては次回の記事で詳しくお話しします。
未来のゲーム
現在の技術の進化は分岐点にあります:一方では、大手企業がすべての能力を「収束」させて自社のAPIの背後に構築し、閉じたエコシステムを作ろうとしています;他方では、開発者がMCPやLocal LLMなどの技術を利用して、「デカップリング」されたオープンエコシステムを構築しようとしています。
未来は現在のユーザー、メーカー、開発者の間のゲームに依存しています。誰の選択も、実際にはこの二つの未来に投票しているのです。