AIエージェントの種類と用途：詳細な説明

まとめ：

AI エージェントには、単純な反応型エージェントからマルチエージェントシステムまで、7 つの異なる種類があります。
現在、大手 AI 企業は、学習エージェントと並行して目標ベースのエージェントの構築に主に焦点を当てています。
将来的には、他の AI エージェントと対話して複数のタスクを実行できる、真に自律的な AI エージェントが登場するかもしれません。

アクション駆動型の AI エージェントが AI 革命をリードすることは明らかであり、その兆候はすでに現れています。 AI 搭載のチャットボットから、メールを読んだり予約を取ったりできる AI エージェントまで、私たちはエージェントの時代に突入しようとしています。 AI エージェントをより深く理解するために、さまざまな種類の AI エージェントについて詳しく説明しました。さらに、すでに市場に出ている主要企業と既存の AI エージェントもリストアップしました。それでは、始めましょう。

1. 単純な反応を示す薬剤

最も単純なタイプの AI エージェント、つまり単純な反応をするエージェントから始めましょう。名前が示すように、これらのエージェントは「if-then」条件に従って、現在の情報に基づいてアクションを実行します。たとえば、サーモスタットは、温度が特定の点以下に下がると暖房をオンにします。条件が真の場合にアクションを実行するだけです。

ただし、このタイプの AI エージェントにはいくつかの制限があります。現在の情報（「認識」または知覚とも呼ばれます）のみを考慮します。以前の温度測定値を記憶したり、将来の測定値を考慮したりすることはなく、現在の温度に基づいてのみ動作します。

単純な反応エージェントにはメモリがなく、環境が完全に観察可能な場合、つまり意思決定に必要なすべての情報が利用可能な状態の場合のみ動作します。その結果、世界の内部表現やモデルは保持されません。

2. モデルベースの反射エージェント

次に、モデルベースの反射エージェントは、単純な反射エージェントのパフォーマンスを向上させます。このタイプのエージェントは世界の内部表現を維持するため、メモリを持ちます。本質的に、これらのエージェントはアクションとそれが世界に与える影響を追跡し、内部モデル/表現を更新します。たとえば、自動運転車は、交通をナビゲートしながら、車両が現在の位置から移動した場合でも、その位置を記憶します。この内部表現により、より多くの情報に基づいた意思決定が可能になります。

次に、エージェントは過去の観察と現在の情報に基づいて世界の内部表現を作成し、目的のアクションを実行します。これは、モデルベースの反射エージェントが部分的に観測可能な環境で動作できることを意味します。基本的に、内部モデルは次のアクションを予測するために使用されます。このモデルは高度な人工知能アルゴリズムに基づいています。

3. 目標ベースのエージェント

名前が示すように、目標主導型エージェントは結果主導型エージェントであり、最終目標に近づくための将来のアクションを考慮します。これらのエージェントは、調査を実施し、作戦を計画し、目的の目標に導くさまざまな一連のアクションを検討することができます。目標ベースのエージェントは、将来の結果を考慮して行動します。

たとえば、ルートを計画する GPS は、目的地に至るすべての道路を検索して考慮する必要があります。距離、所要時間、現在の交通状況などに基づいて、すべての可能なルートを考慮します。次に、この情報に基づいて、目標ベースのエージェントが目的の目的地に到達するための最適なパスを計画および選択します。このタイプのエージェントは、戦略的な計画を必要とする AI アプリケーションに不可欠です。

4. 利益ベースのエージェント

ユーティリティベースエージェントは目標ベースエージェントの一種ですが、特定の目標に結び付けられていません。たとえば、目標指向のエージェントは、目標を達成するか達成しないかという二元論のみで考えます。しかし、効用ベースのエージェントは世界のさまざまな状態を考慮し、複雑な好みに基づいてさまざまな結果を評価し、自分の「効用」を最大化するアクションを選択します。

このタイプのエージェントは、さまざまなアクションシーケンスに数値スコアを割り当て、最も高いユーティリティスコアを提供するアクションのみを選択することで機能します。ユーティリティベースのエージェントは、結果が不確実な状況向けに設計されます。たとえば、AI を活用した取引システムの目標は利益を最大化することですが、ユーザーが許容できるリスクの程度や現在の市場状況も考慮する必要があります。これには、潜在的なリスクとリターンの慎重な分析が必要です。

本質的に、ユーティリティベースのエージェントは、決定を下す前にさまざまな好みを考慮し、結果を評価します。彼らの目標は、目標を達成することだけではなく、さまざまな要素のバランスをとって最適な行動を見つけることです。つまり、状況を総合的に評価した上で「期待効用」を最大化することを目指すのです。

5. 学習エージェント：AIシステムのパフォーマンス向上

学習エージェントは、定義上、過去の経験から学習することで時間の経過とともにパフォーマンスを向上させることができます。学習エージェントの最大の特徴は、未知の環境に適応し、フィードバックに基づいてアクションを最適化できることです。学習エージェントには、エージェントのパフォーマンスに関するフィードバックを提供する「重要な」コンポーネントがあり、これは学習プロセスにとって非常に重要です。

例を説明するために、電子メールのスパムフィルターがどのように機能するかを考えてみましょう。スパムフィルターには、まず基本的な一連のルールがあります。ただし、メールをスパムとしてマークし続けると、エージェントは提供された評価 (「批評」) を通じて学習し、動作を適応させます。今後、これらのメールは自動的にスパムとしてマークされ、別のフォルダーに移動されます。このプロセスは、機械学習分野の高度なアルゴリズムに依存しています。

6. ねずみ講

階層型エージェントは、複雑な目標をサブ目標に分割するタイプのエージェントです。複数のステップの手順と問題解決を必要とする複雑なタスクが数多くあります。このような場合、タスクはより小さく、より管理しやすいサブ問題に分割され、階層的に編成されます。現在、下位レベルのエージェントにそれらのタスクが委任され、上位レベルのエージェントが戦略と最終的な出力を制御します。

例えば、AIロボットに夕食の準備を依頼すると、パスタやソースを作るといったタスクを高レベルエージェントが計画して分担します。これらの作業は、コンロの点火や鍋への水の追加など、さらに細分化されます。このように階層的に、タスクは 1 つのレイヤーから次のレイヤーへと完了します。このアプローチにより、複雑なタスクを効率的かつ効果的に実行できるようになります。これは、高度な AI アプリケーションでは非常に重要です。

7. マルチエージェントシステム

最後に、複数の独立したエージェントを組み合わせて共通の目標を達成するマルチエージェントシステム (MAS) について説明します。これらのシステムにより、複数のエージェントが相互に通信、対話、潜在的なアクションの調整、交渉、協力を行うことができます。このようなシステムでは、各エージェントは独立して動作し、独自の意思決定能力を持ちます。

ただし、競合を回避し、共通の目標を達成するには、すべてのエージェントが共通のマルチエージェントシステムプロトコルに準拠する必要があります。たとえば、サプライチェーンシステムでは、在庫を追跡するエージェントが複数存在し、別のエージェントが在庫要件に基づいて購買部門に報告し、ロジスティクスエージェントが最適な配送ルートを見つける、といったことが行われます。マルチエージェントシステムは、独立したエンティティ間の調整と協力を必要とする複雑な問題に対する効果的なソリューションです。

大手テクノロジー企業の現在のAIエージェント

すでに市場にはさまざまなタイプの AI エージェントが存在します。 OpenAI、Google、Microsoft、Anthropic、Salesforce などの多くの企業が、ターゲットを絞った AI の力を効果的に活用するための AI エージェントとフレームワークを構築しています。以下に、チェックできる AI エージェントをいくつか示します。これらのツールは現在も継続的に開発および改善中であることを念頭に置いてください。

OpenAI

OpenAIは、オペレーターAIエージェント消費者向け。コンピューターを使ってウェブ上のタスクを自動化するエージェントです。オペレーターはウェブブラウザと対話し、クリック、入力、スワイプなどの操作でアクションを実行できます。フォームへの入力、航空券の予約、食料品の注文など、様々な用途に使用できます。ただし、まだ完全な自律動作ではありません。支払いは手動で行い、必要に応じてCAPTCHAを入力する必要があります。このエージェントは、複雑なタスクを効率的に実行できるAIの開発に向けた大きな一歩です。

オペレーターは、目標ベースの学習エージェントのカテゴリに分類される可能性があります。目標主導型であり、Web サイトとのやり取りから学習します。さらに、 OpenAIのディープリサーチエージェント複雑な複数ステップの調査タスクを実行し、テキスト、画像、PDF ファイルを分析して包括的なレポートを生成します。これは、目標ベースのエージェント、学習エージェント、およびタスクをより小さなサブタスクに分割する階層型エージェントの組み合わせだと言えます。これらの機能により、研究者やアナリストにとって強力なツールとなります。

さらに、OpenAIは最新の o3 と o4-mini これらは単なるAIモデルではなく、エージェントのようなAIシステムです。これらの新しいAIシステムはエージェントのように動作し、Web検索、Pythonインタープリタ、画像解析、Plusなど、幅広いツールと連携できます。これらはモデルベースおよびゴールベースのエージェントであり、AI機能の大きな進歩を表しています。

最後に、開発者がターミナルからコードを読み取り、編集し、実行できるようにする OpenAI の最新の Codex CLI ツールは、別のタイプの AI エージェントです。エラーを自動的に修正し、新しい機能を作成し、ファイルを変更できます。繰り返しますが、これは学習エージェントを使用して構築された目標ベースのエージェントです。このツールは開発者の生産性を大幅に向上させます。

グーグル

これまでのところ、Googleは Gemini のディープリサーチ AI エージェントこれは OpenAI のエージェントと同様に動作します。彼はウェブを閲覧し、必要な情報をマッピングし、その情報を編集して、あらゆるトピックに関する包括的なレポートを作成できます。私はこのエージェントを目標ベースの学習エージェントとして分類しており、人工知能の分野では先進的なものとなっています。

次に、Google はまだ開発中の Project Mariner を発表しました。このプロジェクトは OpenAI の Operator AI エージェントのように動作し、Chrome ブラウザでタスクを自動化できます。アクティブな画面を分析し、Web サイトでアクションを実行できます。 Google によれば、このエージェントは信頼できるテスターによってテストされており、近い将来にリリースされる予定だという。

さらに、Googleはエージェント2エージェント（A2A）プロトコル新機能により、複数の AI エージェントが相互に通信できるようになります。これはエージェントそのものではなく、マルチエージェントシステム (MAS) を可能にする標準/フレームワークです。

人間原理

OpenAIと同様に、Anthropicもデスクトップコンピュータ環境と対話できる「コンピュータ使用」AIエージェント（現在はベータ版）を発表しました。画面を分析し、クリック、入力、ファイル操作を実行できます。これは Web ブラウザに限定されず、オペレーティングシステムレベルでもアクションを実行できます。言うまでもなく、これは目標ベースの学習エージェントです。

さらに、Anthropic は最近、Workspace on Cloud を統合した検索ツールをリリースしました。 Gmail、カレンダー、ドライブ、ウェブに接続して調査を実施し、洞察を抽出できます。同様に、Claude Code はターミナル内で実行されるプロキシコーディングツールです。コードベースを理解しており、ファイルを変更したり、テストを実行したり、Git と対話したりすることもできます。どちらも目標ベースのエージェントです。

最後に、Anthropic は、AI モデルを外部データソースに接続するためのオープンスタンダードである Model Context Protocol (MCP) を開発し、AI エージェントが API なしのサービスで確実に動作できるようにしました。エージェントではありませんが、AI モデル、ツール、Web サイト、その他のデータソース間の通信を可能にします。方法はこちら Windows および macOS で Cloud に MCP を設定する.

Microsoft

消費者サービス分野では、Microsoft がチャットボット Copilot 向けの新しい AI エージェントをいくつか発表しました。エージェントは Copilotの徹底的な研究複数のステップから成る調査を実施して、特定のトピックに関する包括的なレポートを作成します。さらに、副操縦士の行動ウェブからチケットの予約、予約、商品の購入ができます。ただし、パートナーの Web サイトでのみ機能します。

企業向けに、Microsoft は最近、Copilot Studio の Computer Use AI エージェントを発表しました。専用の API に依存しないで、Web サイトやデスクトップアプリケーションと直接対話してアクションを実行できます。 Microsoft はまた、企業のサイバーセキュリティに不可欠な要素であるフィッシング警告、データセキュリティ、ID 管理を支援する Security Copilot エージェントも発表しました。

Microsoft はエンタープライズ顧客向けに複数の Copilot エージェントを開発しており、ワークフロー用のカスタム AI エージェントを作成することもできます。 Copilot Studio を使い始めると、MCP サーバー、API、外部ソースを接続してタスクを自動化し、作業の生産性を向上させ、潜在的なエラーを減らすことができます。

Salesforce

Salesforce は、Microsoft に加えて、自律的でカスタマイズ可能な AI エージェントを提供するエンタープライズ顧客向けの Agentforce プラットフォームを開発しました。ビジネスユーザーは、Agentforce で複数の AI エージェントを作成、展開、管理して、リードを生成したり、販売を最適化したり、マーケティングを管理したりすることができます。 Agentforce は、人工知能を使用したビジネスプロセス自動化の主要プラットフォームです。

Salesforce は、Microsoft の Copilot とは異なり、Agentforce エージェントは事前定義されたイベントまたはトリガーに基づいて独立してアクションを実行できると主張しています。 Agentforce エージェントは、データベース内のレコードを更新したり、電子メールを送信したり、会議を予約したり、保留中のケースを解決したりすることができます。これらの機能により、Agentforce は顧客サービスと販売タスクを自動化する強力なツールになります。

これらは、現在市場で入手可能な AI エージェントを調べて見つけることができる AI エージェントの種類です。今後、AI エージェントは、消費者側でも企業側でも、インターネットエクスペリエンスの不可欠な要素になるでしょう。 AIエージェント市場は、自動化と効率性の向上に対する需要の増加により、今後数年間で大幅な成長が見込まれています。