背景
Auto-GPTはユーザーの目標入力に基づいて計画を立て、計画を解析し、分解し、実行し、実行結果を評価し、外部リソースを活用しながら継続的に結果を生成し、段階的に目的を達成する自己完結型エージェントです。
私はAuto-GPTのプロンプトが自動で更新される仕組みに非常に興味を持っています。
Auto-GPTの詳細説明

ユーザーの目標入力 + 初期システムプロンプト =>
Memory記憶庫を検索 =>
過去のMemoryを取得 =>
計画を立てる =>(初回/次回)プロンプトを生成 =>
LLM (ReActフレームワーク)を呼び出して計画を実行 =>
現在の状態を更新 (次ラウンドのプロンプト生成に使用) =>
ツールやコンポーネントを呼び出して計画を実行 =>
現在の結果に基づき、次のステップを実行するために「計画を立てる」に戻るか、直接完了(Done)するか判断
AutoGPTの評価
LLMのタスク分解の不安定さにより、毎回のループで計画立案時にプロンプトの爆発的増加が見られます。生成される計画も制御困難な変動を伴います。商用エージェントではほとんどAuto-GPTフレームワークは利用されません。
安定したAutonomous Agent構造
Goal
↓
Planner
↓
Task Queue
↓
Executor
↓
Evaluator
↓
Memory
↓
Loop
Autonomous Agentの評価
問題: 説明:
コスト LLM呼び出し回数が多い
安定性 タスクプランニングの不安定さ
制御性 デバッグが困難
安全性 誤った操作を実行する可能性がある
参考文献
“Auto-GPT for Online Decision Making: Benchmarks and Additional Opinions”
https://www.semanticscholar.org/reader/3b8871e4c25d3aaca2bee6606c07bc870337253c