Skip to content
馬場 高志2024/08/16 10:00:001 min read

AIエージェント – その可能性と課題|イノーバウィークリーAIインサイト -14

 

AIの次のステージとして注目を集めているのが「AIエージェント」というキーワードです。AIエージェントは、例えば航空券の予約やソフトウェアのバグの発見と修正など、実世界で行動し、仕事を実行してくれるAIシステムです。

関連記事:AIエージェントの進化 – セコイアキャピタルが示す最新トレンド|イノーバウィークリーAIインサイト - 3

今回は、「エージェントはAIの未来」と題されたForbes記事やプリンストン大学のコンピュータ科学者アーヴィンド・ナラヤナン教授とサヤッシュ・カプールのブログ記事を参考に、AIエージェントとは何か、その現状と課題、有望な応用分野について考察します。

 

AIエージェントが注目される理由

AIエージェントが注目を集める最大の理由は、その潜在的な市場規模にあります。従来のソフトウェア製品は、人間の生産性を向上させるツールでした。一方、AIエージェントは人間の労働そのものを置き換える可能性を持っています。

 

企業の費用全体を見ると、平均して約70%が従業員の人件費であり、ソフトウェア製品には10%未満しか割り当てられていません。AIエージェントは、特定の業務において従業員と同等の仕事をこなすことが期待され、従業員の給与に近い価格設定が可能になります。これらは、AIエージェントが従来のソフトウェア製品よりもはるかに大きな市場を開拓できる可能性を意味しており、それが、AI関連企業がこぞってAIエージェントを目指す理由になっています。

 

AIエージェントとは何か

AIエージェントの定義は、研究者や企業によって様々です。しかし、AIエージェントを特徴づける要素について、ある程度の共通認識が形成されつつあります。プリンストン大学のナラヤナン教授たちは、AIシステムのエージェント性を評価するための3つの軸を提案しています。

 

  1. 環境と目標
    複雑な環境で動作し、複雑な目標を追求するシステムほど、よりエージェント的(「Agentic」)と見なされます。
  2. ユーザーインタフェースと監視
    自然言語で指示を受け、ユーザーに代わって自律的に行動できるシステムほど、よりエージェント的です。特に、ユーザーの監視をあまり必要としないシステムは、よりエージェント的であるといえます。
  3. ツール使用とシステム設計
    ウェブ検索やコード生成などのツールを使用したり、計画を立てたりするシステムほど、よりエージェント的です。LLM(大規模言語モデル)が静的なプログラムによって呼び出されるのではなく、LLMによってシステムフローが制御されるシステムは、よりエージェント的であるといえます。

これらの3つの軸は、システムが「エージェントである」か「エージェントでない」かを二分化するためのものではなく、どの程度エージェント的な特性を持っているかを評価するための視点です。つまり、特定のAIシステムがエージェントであるかないかの定義にこだわることに意味はなく、連続的なスペクトラムでエージェント性を捉えるのが実用的だというのです。

AIエージェントの現状と課題

AIエージェントの概念は魅力的で、すでに有用だと評価されるサービスもいくつか出てきていますが、現実世界での実用化にはまだ課題が多いのが現状です。例えば、ChatGPTにはアップロードしたファイルを編集・分析し、グラフを出力するためのプログラムを生成し実行できるCode Interpreterという機能があります。これはエージェント的な機能であり、非常に役に立つと評価されていますが、より野心的なエージェントベースの製品は今のところ失敗に終わっています。

 

Rabbit R1やHumane AI pinといったAI搭載の小型デバイスが今年相次いで発表されました。Rabbit R1は、Uberで車を呼んだり、DoorDash(Uber Eatsのようなサービス)でフードデリバリーを頼んだりといった指示を、簡単に音声でできるというデバイスですが、処理が遅すぎたり信頼性を欠き使い物にならないという評価が多く成功しているとはいえません。また、「AIソフトウェアエンジニア」として発表されたDevinは、発表時のビデオでデモされた内容が虚偽であったと非難され、4ヶ月経った今でも一般公開はされていません。

aiweekly14-1

Humane AI Pin (左)と Rabbit R1(右) (出典 Algorithm Live)

これらの失敗は、AIエージェントが実用的な製品となるためには、まだ解決すべき研究課題が多いことを示しています。特に重要なのは信頼性の向上です。

 

例えば、航空券予約を実行するAIエージェントは、複数の複雑なタスクを連続して行う必要があります:あなたのeメールやスケジュールをチェックしていつどこに旅行するのか把握し、あなたの席の好み(窓側/通路側、昼間便/夜行便)を記憶し、それに合ったフライトを調査・選択し、あなたの支払い情報を検索し、最後に航空会社の予約システムにアクセスして予約を完了させるなどのタスクです。

 

こうした一連の手順には数十回のLLM呼び出しが必要となるかもしれません。しかし、LLMにはハルシネーション(幻覚)の問題があるため、もし各呼び出しが2%の確率で失敗するとした場合、システム全体の信頼性は極めて低くなり、実用に耐えません。したがって、信頼性を向上させる研究の進展がAIエージェントの発展の一つの鍵となります。

 

AIエージェントが有望な分野

Forbes記事では、AIエージェントの実用化に適した分野を選ぶためのいくつかの基準を説明しています。

さきほど説明したように、LLMの信頼性にはまだ問題があるので、AIエージェントは、現状では特定の業務プロセスや垂直市場向けに限定する必要があります。「エージェント化」に適した市場は、主に以下の特徴を持っています。

 

構造化された反復可能な活動

ソフトウェアエンジニアリング、規制コンプライアンスなどがこれに該当します。これらの機能は、一貫したパターンを持つルーチンワークフローで構成されており、学習や監査が可能でAIエージェント化に適した仕事だといえます。これは上記の「環境と目標」という軸で見るとエージェント的特性の低い領域ということになります。

 

「自然な人間介在ステップ」の存在

現在のAIでは適用できない例外的なケースも多く存在します。ある程度の人間による監視がなければ、これらのシステムを本番環境で使うことはできません。幸い、レビューおよび承認するステップが明確に分離されているワークフローは企業のなかに多く存在しています。人間介在のステップが明確に組み込まれている仕事はAIエージェント化に適しているといえます。しかし、これは上記の「ユーザーインタフェースと監視」の軸ではエージェント特性の低い領域ということになります。

 

これらの基準を踏まえ、Forbes記事ではAIエージェントが特に有望と考えられる具体的な分野と、その理由、そして実際のスタートアップの例をいくつか紹介しています。

 

カスタマーサポート

カスタマーサポートは、AIエージェントの応用に適した分野の代表例です。グローバルなコンタクトセンター市場規模は2023年に推定3,320億ドルで、2030年までに5,000億ドル以上に成長すると予測されています。

 

カスタマーサポートが適している理由
  • 標準化された反復的な活動が多い(構造化された反復可能な活動)
  • 顧客自身や顧客サポートマネージャーが「自然な人間介在ステップ」として機能し、エージェントの行動を監視できる

 

例えば、Sierraというスタートアップは、顧客からの問い合わせにリアルタイムで応答し、必要な顧客情報を内部システムやAPIを通じて取得し、顧客の要求を満たすために必要なアクションを取ることができるAIカスタマーサポートエージェントを開発しています。なお、Sierraは、従来のソフトウェア・サブスクリプション・モデルではなく、完了した作業に基づいてエージェントの価格を決定する計画だそうです。

 

規制コンプライアンス

企業は毎年、数百億ドルを規制遵守のために費やしています。コンプライアンス業務は、AIエージェントに適した特性を持っています。

 

規制コンプライアンスが適している理由
  • 高度に構造化され、パターンベースで反復可能な作業(構造化された反復可能な活動)
  • フロントラインのアナリストと管理者という階層構造があり、AIエージェントをアナリストの代替として導入しやすい(「自然な人間介在ステップ」の存在)

 

例えば、Norm Aiは、企業の業務を継続的にレビューし、特定の活動が特定の規制に準拠していない場合に識別し、コンプライアンスを確保するための是正措置を提案するエージェントシステムを開発しています。Normのエージェントがサポートしている法令には、大気浄化法(213,796語)、医療費負担適正化法(371,810語)、米国障害者法(22,481語)などがあります。これらの法律の長さと複雑さを考えると、自動的に分析し適用する能力が求められる理由が理解できます。

 

データサイエンス

データサイエンスは、ソフトウェア開発と同様に、複雑で高給ではあるが構造化された反復可能な活動であり、AIエージェントに適しています。

 

データサイエンスが適している理由
  • 問題のフレーミングからモデルの展開まで、一連の構造化されたプロセスがある(構造化された反復可能な活動)
  • データサイエンティストや関連するステークホルダーが結果をレビューする体制が確立されている(「自然な人間介在ステップ」の存在)

 

例えば、Delphinaは、問題のフレーミング、データの選択と変換、特徴量エンジニアリング、モデルのトレーニング、デプロイ後のモデルのモニタリングと改善など、データサイエンスのライフサイクル全体を自動化するエージェントを開発しています。

 

これらの分野では、AIエージェントが既存の業務フローに自然に組み込まれ、人間の専門家と協調しながら効果的に機能することが期待されています。同時に、各分野の特性に合わせてカスタマイズされることで、信頼性と実用性を高めることができるのです。

 

おわりに

生成AIが、私たちの問いに答える形のチャットボットにとどまらず、エージェントとしての使い方が拡がっていけば、私たちの生活や仕事をさらに大きく変革し、より大きな経済的インパクトをもたらすようになるでしょう。

今のLLMには信頼性の問題があるため、現段階のAIエージェントはあまり複雑ではなく構造化された反復可能な分野にしか適用できません。まずは、これらのハードルが低い領域で実際にどれだけAIエージェントが広まっていくかが第一の注目ポイントです。しかし、中長期的にAIエージェントが大きな経済的ポテンシャルを発揮するためには、より複雑な環境で自律的に仕事ができるシステムに進化していく必要があるでしょう。

AIエージェントは、単なるバズワードではありません。それは人工知能システムの必然的な未来の形態といえます。マーケターは、この技術の進化を注視し、その可能性と課題を深く理解することが求められます。

avatar

馬場 高志

1982年に富士通に入社、シリコンバレーに通算9年駐在し、マーケティング、海外IT企業との提携、子会社経営管理などの業務に携わったほか、本社でIR(投資家向け広報)を担当した。現在はフリーランスで、海外のテクノロジーとビジネスの最新動向について調査、情報発信を行っている。 早稲田大学政経学部卒業。ペンシルバニア大学ウォートン校MBA(ファイナンス専攻)。