背景
このアーキテクチャの目標は、完全な AI オペレーティングシステム(AI OS)を構築することです。これにより以下が可能になります:
- LLM の接続
- ツールの管理
- スキルの管理
- メモリの管理
- エージェントのサポート
- ワークフローのサポート
- MCP のサポート
- 複数データソースのサポート
多くの AI プロダクトの基盤構造はこれに似ています(例:OpenAI、Anthropic、Google のエージェントシステム)。
企業向け AI OS システム
┌──────────────────────────────┐
│ 1 UI Layer │
└──────────────────────────────┘
│
┌──────────────────────────────┐
│ 2 API Gateway │
└──────────────────────────────┘
│
┌──────────────────────────────┐
│ 3 Agent Controller │
└──────────────────────────────┘
│
┌──────────────────────────────┐
│ 4 Planning Layer │
└──────────────────────────────┘
│
┌──────────────────────────────┐
│ 5 Context Engine │
└──────────────────────────────┘
│
┌──────────────────────────────┐
│ 6 Tool / Skill Layer │
└──────────────────────────────┘
│
┌──────────────────────────────┐
│ 7 Workflow Engine │
└──────────────────────────────┘
│
┌──────────────────────────────┐
│ 8 Memory Layer │
└──────────────────────────────┘
│
┌──────────────────────────────┐
│ 9 Knowledge / RAG │
└──────────────────────────────┘
│
┌──────────────────────────────┐
│ 10 Infrastructure Layer │
└──────────────────────────────┘
2. 第1層:UI Layer
ユーザーインターフェース。
含まれる可能性があるもの:
Web Chat
Mobile App
Slack Bot
API
Voice
例:
チャットインターフェース
ファイルアップロード
音声インタラクション
UI 層は複雑なロジックを持つ必要はありません。
主な役割:
- ユーザー入力の受付
- 結果の表示
3. 第2層:API Gateway
すべてのリクエストはまず API 層を通過します。
役割:
- 認証
- ロギング
- レート制限
- ルーティング
技術例:
FastAPI
Flask
Gateway
例えば:
POST /chat
POST /tool
POST /workflow
4. 第3層:Agent Controller
AI システムのコアスケジューラです。
役割:
- タスクの受け取り
- エージェント状態の管理
- プランナーの呼び出し
- ツールの実行
- ループ実行の管理
典型的な構造:
AgentState
{
goal
plan
current_step
memory
}
実行ループ:
while not finished:
plan
act
observe
これは古典的なエージェントループです。
5. 第4層:Planning Layer
プランナーの役割:
複雑なタスクをステップに分割する
例としてユーザーが:
AI 業界レポートを作成してほしい
プランナーは以下を生成します:
1 資料検索
2 企業抽出
3 トレンド分析
4 レポート作成
プランナーの種類:
LLM プランナー
ルールベースプランナー
ハイブリッドプランナー
6. 第5層:Context Engine(極めて重要)
多くのシステムがこの層を見落としています。
Context Engine は以下を担当:
プロンプトコンテキストの構築
ソースは:
- ユーザー入力
- 履歴会話
- メモリ
- RAG ドキュメント
- ツール結果
- システムプロンプト
最終的に構築されるもの:
LLM プロンプト
例:
システムプロンプト
ユーザークエリ
メモリ
ドキュメント
ツール
Context Engine は AI システムの最重要コンポーネントの一つです。
7. 第6層:Tool / Skill Layer
AI 能力はツールから生まれます。
ツールの種類:
1 外部API
例:
天気 株価 検索
2 システムツール
例:
メール送信 ファイルの読み書き データベースクエリ
3 スキル
スキル = 複数ツールの組み合わせ
例:
generate_report
内部では:
search
analyze
summarize
スキルは本質的に:
ワークフローです。
8. 第7層:Workflow Engine
複雑なタスクはワークフローが必要です。
対応機能:
- ステップ実行
- リトライ
- 並列実行
- タイムアウト
- 分岐
例:
step1 検索
step2 抽出
step3 分析
step4 作成
代表的なオープンソースツール:
Temporal
Apache Airflow
Prefect
9. 第8層:Memory Layer
AI システムにはメモリが必須です。
3種類に分類されます。
- 会話メモリ(Conversation Memory):会話履歴
- ユーザーメモリ(User Memory):ユーザー情報、ユーザーの好み
- セマンティックメモリ(Semantic Memory):埋め込み、ベクトルデータベース
10. 第9層:Knowledge / RAG
RAG:
Retrieval Augmented Generation(検索強化生成)
プロセス:
ユーザークエリ
↓
埋め込み生成
↓
ベクトル検索
↓
上位 k 件のドキュメント取得
↓
LLM に入力
利点:
幻覚を減らし、プライベート知識を活用可能
11. 第10層:Infrastructure Layer
最下層。
含まれるもの:
- LLM
- DB
- キャッシュ
- キュー
典型的コンポーネント:
LLM:
- OpenAI
- Anthropic
- ローカルモデル
データベース:
- PostgreSQL
- MongoDB
キャッシュ:
- Redis
メッセージキュー:
- Kafka
- RabbitMQ
11 Guardrail Layer
セキュリティ制御。
例:
- コンテンツフィルタリング
- PII 保護(個人情報保護)
- プロンプトインジェクション対策
12 Tool Registry
ツール登録センター。
管理情報:
- ツール名
- 説明
- スキーマ
- エンドポイント
エージェントはレジストリを通じてツールを発見します。
最終完全アーキテクチャ(推奨)
User
│
▼
UI
│
▼
API Gateway
│
▼
Agent Controller
│
▼
Planner
│
▼
Context Engine
│
▼
Tool Router
│
▼
Tools / Skills
│
▼
Workflow Engine
│
▼
Memory
│
▼
RAG
│
▼
Infrastructure
実際の実行例
ユーザー:最近のAI資金調達状況を分析してほしい
システムの実行フロー:
ユーザークエリ
↓
Agent Controller
↓
Planner
↓
プランステップ
↓
Tool Router
↓
search_news ツール
↓
extract_companies
↓
finance API
↓
LLM 分析
↓
レポート生成
非常に重要な設計原則
企業向け AI システムは
LLM + プロンプト
ではなく、
LLM + データ + ツール + メモリ + ワークフロー + 制御
本質は:
AI オペレーティングシステム