AIAgent之完整的系统架构

完整的架构结构 Architecture

Intent Layer
Planning Layer
Execution Layer
Tool Layer
Memory Layer
Knowledge Layer
Policy & Guardrail Layer
Observability Layer
Persistence Layer
Governance Layer

1, 第一层:Intent Router

Router 需要判断是否调用Tools

Router Prompt:

prompt = ‘

	You are a task classifier.
	User query: {query}
 
	Classify the user query into one of:
 
	1. simple_qa
	2. retrieval
	3. tool_call
	4. multi_step
 
	Return JSON:
	{
  		"type": "..."
	}
’

2, 第二层:ReAct Tool Core

simple_qa ==》LLM直接回答

retrieval ==》调用向量数据库直接检索/调用Browser检索

tool_call  ==》进入ReAct循环
multi_step ==》进入ReAct循环

ReAct循环的架构:

LLM decides next action
↓
Call one tool
↓
Append tool result
↓
Repeat

Sample Code:

while True:
 
    response = llm(messages, tools=tool_schema)
 
    if response.tool_calls:
        result = execute_tool(...)
        messages.append(tool_result)
 
    else:
        break

3, 第三层:Structured Tool Layer

这里采用ChatGPT的Function Calling的思想,通过定义“Tools Schema”来连接LLM和Tools的调用.

企业级AIAgent:ReAct + Function calling: https://strictfrog.com/2026/02/17/%E4%BC%81%E4%B8%9A%E7%BA%A7AIAgent%E5%A6%82%E4%BD%95%E8%B0%83%E7%94%A8Tools%E4%B9%8BReAct/

4, 第四层:Guardrails & Policies

最大步骤限制:

max_steps = 15

不允许发送敏感邮件:

if tool = send_mail:
	require confirmation

5, 第五层:Memory Layer

统一 Memory 体系（长期 + 短期）

1️⃣ 短期记忆（Session Memory）
	•	当前任务的状态
	•	工具调用历史
	•	决策中间结果
2️⃣ 长期记忆（Persistent Memory）
	•	用户历史偏好
	•	历史任务记录
	•	决策结果存档
	•	邮件发送日志
否则系统无法：
	•	回溯
	•	分析
	•	审计
	•	学习优化

7, 第七层: Policy & Guardrail Layer

Policy & Safety Layer（安全控制）
现在可以自动发邮件。
危险问题：
	•	如果 prompt 注入？
	•	如果用户让它群发？
	•	如果泄露敏感信息？
	•	如果调用危险 API？
成熟系统必须有：
Guardrails
	•	工具调用白名单
	•	参数验证
	•	风险评分
	•	人工确认节点
	•	速率限制

8, 第八层:Observability Layer

Observability（可观测性）
必须能回答：
	•	哪个工具调用失败最多？
	•	平均任务执行多少步？
	•	LLM token 消耗多少？
	•	邮件成功率？
	•	哪个步骤最耗时？
这需要：
	•	结构化日志
	•	Step-level trace
	•	Metrics
	•	可视化 Dashboard
否则无法优化。

9, 第九层:Persistence Layer

任务持久化（Persistence）
必须支持：
	•	任务中断恢复
	•	异步执行
	•	多用户并发
	•	失败重试
	•	延迟执行
需要：
	•	Redis / DB 存储状态
	•	每个 Task 一个唯一 ID
	•	状态机持久化
否则不是系统，只是脚本。

Tool Governance（工具治理）

当工具超过 10 个时，会出现：
	•	工具冲突
	•	参数混乱
	•	错误路由
	•	LLM 选择错误工具
成熟系统需要：
	•	工具注册中心
	•	Tool Capability 描述
	•	工具优先级
	•	工具调用日志

Error Recovery Strategy

现在是：
 报错 → 程序崩溃

成熟系统必须有：
	•	自动重试
	•	备用模型
	•	回退策略
	•	LLM 自我修复提示

成本控制层

成熟系统必须监控：
	•	Token 使用量
	•	工具调用成本
	•	API 费用
	•	模型选择策略（小模型优先）
否则成本不可控。

人类干预节点（Human-in-the-loop）

当出现：
	•	高风险操作
	•	置信度低
	•	多候选模糊
必须：
 Agent → 请求人工确认

否则不能用于真实业务。

成熟的系统结构图

		┌──────────────────┐
                │   API Gateway    │
                └──────────────────┘
                          ↓
                ┌──────────────────┐
                │ Intent Router    │
                └──────────────────┘
                          ↓
                ┌──────────────────┐
                │ ReAct Engine     │
                └──────────────────┘
                          ↓
          ┌───────────────┼────────────────┐
          ↓               ↓                ↓
   Tool Layer       Knowledge Layer     Memory Layer
          ↓               ↓                ↓
                ┌──────────────────┐
                │ Policy Layer     │
                └──────────────────┘
                          ↓
                ┌──────────────────┐
                │ Persistence DB   │
                └──────────────────┘
                          ↓
                ┌──────────────────┐
                │ Observability    │
                └──────────────────┘

总结

成熟系统的标志
•	同时服务 100+ 用户
•	支持长链任务
•	中断恢复
•	失败自动修复
•	有完整审计日志
•	有成本统计
•	有安全策略
•	有人工审批节点

完整的架构结构 Architecture

1, 第一层:Intent Router

2, 第二层:ReAct Tool Core

ReAct循环的架构:

3, 第三层:Structured Tool Layer

4, 第四层:Guardrails & Policies

5, 第五层:Memory Layer

7, 第七层: Policy & Guardrail Layer

8, 第八层:Observability Layer

9, 第九层:Persistence Layer

Tool Governance（工具治理）

Error Recovery Strategy

成本控制层

人类干预节点（Human-in-the-loop）

成熟的系统结构图

总结

CATALOG

FEATURED TAGS

FRIENDS