
楽天とGoogleが描く、自律型AIエージェントの次なるフロンティア
楽天テクノロジーカンファレンスのセッションレポート
超知的な仮想アシスタントや自律型ロボットはSF小説の産物のように思えるかもしれませんが、現実はそのイメージとの距離を急速に縮めています。東京で開催された楽天テクノロジーカンファレンスでは、「AIエージェントの次世代」をテーマにしたセッションが行われ、その最前線に立つ二人の登壇者が現在地と展望を語りました。楽天のAIサービス監督部門ディレクターである大越卓氏と、GoogleのApplied AI EngineeringバイスプレジデントであるHamidou Dia氏が登壇し、AI進化の軌跡と、その先に広がる可能性を聴衆に示しました。
「チャットボット」から「エージェント」へ。楽天が描くAIの新たな役割
楽天グループは日本国内だけで70を超えるサービスを展開し、1億人以上のユーザーと接点を持つ巨大なデジタルエコシステムを形成しています。eコマース、銀行、決済、旅行、モバイルなど多岐にわたるサービス群を抱えるなかで、AIに求められる役割もまた大きく変容しつつあります。
楽天グループ執行役員でもある大越氏は、同社が掲げる「AI化」というキーワードについてこう述べました。
「楽天グループ全体でAI化をキーワードとして設定しており、日々AIの能力をフル活用しています。AIを楽天エコシステムのゲートウェイとして位置づける。これが私たちの最新のビジョンであり、ミッションです」
このビジョンはすでに具体的な形で実装が始まっています。楽天AIはいまや、ショッピング、ホテルのレコメンデーション、音楽ストリーミングをまたいで機能する中央エージェントとしての役割を担いつつあります。楽天トラベルではインテリジェントなコンシェルジュが旅行プランの立案から宿泊施設の探索まで対応しており、さらにGoogleとの連携によってGoogleマップの機能をシームレスに統合することが可能になったといいます。
「Googleの技術のおかげで、エージェントにGoogleマップの機能を完全に組み込むことができました」と大越氏は語りました。検索・フィルタリング・アプリ間の移動という従来の複数ステップを、コンテキストを記憶した自然な会話の流れへと変容させるこの取り組みは、ユーザー体験の根本的な再設計といえるものです。
AIの系譜。チャットボットから多エージェントシステムへ
Dia氏は、AIの進化の軌跡をわかりやすく整理してみせました。そもそもの出発点はチャットボットであり、ユーザーがプロンプトを入力し、大量の情報を得るというシンプルな関係性に過ぎませんでした。その後、Retrieval Augmented Generation(RAG)と呼ばれる技術が登場し、大規模言語モデル(LLM)が具体的なデータを参照しながら回答を生成できるようになりました。これによってハルシネーション(事実と異なる情報の生成)のリスクが大幅に低減されました。
そして、LLMへの推論能力とファンクションコール機能の実装を経て、AIはツール活用のフェーズへと移行しました。複数ステップの思考をこなせるエージェントが登場し、現在は複数のエージェントが協調して動作する「マルチエージェントシステム」の時代に突入しているといいます。
Dia氏はさらにその先にある大きな地平を見据えています。
「私たちは皆、AGI(汎用人工知能)、すなわちスーパーインテリジェンスに向けて進んでいます。テキスト・画像・動画・音声・コード・音楽をまたいで推論できるマルチモーダルモデル、環境をダイナミックに生成するワールドモデル、そして現実世界の生成とフィジカルエージェントを結ぶマルチエージェントシステム。これが目指すべき姿です」
AIが純粋なソフトウェアの世界を超え、物理空間へと踏み出す未来。その実現を左右するのが、次に述べるロボティクスの課題です。
ロボットはなぜ遅れているのか。物理世界の三つの壁
カンファレンスでDia氏は、ゴミをサンフランシスコ市のルールに従い分別するAI搭載ロボットのデモ映像を紹介しました。コンポスト用の緑のビン、リサイクル用の青のビン、通常のゴミ用の黒のビン。言葉にすると単純ですが、これをロボットが実行することの難しさは計り知れません。
「物理環境は、ソフトウェアと比べてはるかに過酷です。デジタルの世界ならエラーが起きてもやり直せる。でもロボティクスでは、人を傷つけたり物を壊したりするリスクがある」とDia氏は説明しました。
ロボティクスがソフトウェアAIに比べて遅れている理由として、Dia氏は三点を挙げました。第一は、物理世界の複雑さとエラーへの非寛容性です。第二はデータ不足です。LLMの代表格であるMeta Llama 3は15兆語もの言語データで訓練されているのに対し、ロボットの動作データとして公開されている最大のデータセットはわずか約240万件にとどまります。AIがロボットの動作を「理解」するための素材が圧倒的に不足している現実があります。そして第三の障壁はコストです。価格は大幅に低下してきているものの、フィジカルロボット自体の製造コストはいまだ高水準にあります。
こうした課題に対し、Googleが選択した道は「ロボット自体を作ること」ではありません。
「Googleはロボットエンジニアリングそのものではなく、ロボットの上で動くモデルの開発に注力しています。私たちは物理的なロボットを作るのではなく、さまざまな組織がロボットを動かすために活用できる最高のロボティクスモデルを構築しています」
インフラ層を担うモデル開発に徹することで、業界全体のロボティクス普及を後押しする役割をGoogleは目指しています。
信頼・安全・ガバナンス。知性と同等に問われる「統治」の課題
AIエージェントの能力が高まるにつれ、業界の焦点は「いかに賢くするか」から「いかに信頼できるようにするか」へとシフトしています。特にエンタープライズの文脈では、セキュリティ、プライバシー、コンプライアンスという三つの柱が重要性を増しています。
「セキュリティとはポリシーの話でもあります。あなたのデータのプライバシー、エージェントを構築するときの知的財産の保護、エンタープライズの境界内にデータを留めること。これらすべてが問われます」とDia氏は強調しました。
大越氏も同様の問題意識を示しました。金融から通信まで多様な事業を持つ楽天にとって、各事業が遵守すべき日本政府や業界の規制は複数に及びます。そのためAIエージェントのプラットフォームには、規制の多様性に応じた柔軟な設計が不可欠だといいます。
Googleが掲げるのは「オープン」の原則です。Dia氏は「オープンソース、オープンスタンダードがGoogleにとって重要です。このエージェント時代においては、オープンな標準を定義し、あらゆる組織がオープンシステムを活用できるフレームワークを構築することが大切です」と述べました。
さらに、ロールベースのアクセス制御、企業ポリシーの適用、コンプライアンス認証、データレジデンシー(データの保存場所の主権的管理)まで含めた強固なガバナンス基盤の整備が、エージェント展開の前提条件として求められています。国家主権の観点から、データの保存だけでなく処理も特定の国内で完結させる要件がある場面では、クラウドインフラの設計思想そのものが問われることになります。AIエージェントが組織の内側に深く入り込む新たなフェーズにおいて、その未来を決めるのは純粋な知性だけでなく、安全性・柔軟性・予測可能性をいかに担保できるかにかかっているといえるでしょう。
※ AI化(AIナイゼーション)
楽天グループが全事業にわたってAIを実装し、さらなる成長を実現するとともに、誰もがAIの恩恵を享受できる世界の実現にコミットするための取り組み。
Rakuten AI and Google are driving the next generation of autonomous agents
https://rakuten.today/blog/rakuten-ai-and-google-are-driving-the-next-generation-of-autonomous-agents.html
