背景
知己知彼,才能更好的开发私有的AIAgent
一、ChatGPT 天生能做的事情(LLM 原生能力)
| 1 语言理解与生成 | 2 知识推理 | 3 编程能力 | 4 信息结构化 | 5 多模态理解 |
|---|---|---|---|---|
| 问答 | 逻辑推理 | 写代码 | 从文本中抽取 | 图片理解 |
| 总结 | 常识推理 | debug | OCR | |
| 翻译 | 方案设计 | 代码解释 | 图表理解 | |
| 改写 | 架构设计 | API设计 | ||
| 信息提取 | 编程问题 | 架构设计 | ||
| 文本分类 | ||||
| 对话 |
二、ChatGPT 原生做不到的事情
| 1 无法访问私有数据 | 2 无法操作现实世界系统 | 3 无法长期记忆 | 4 无法复杂多步骤规划 | 5 无法保证100%正确 | 6 上下文窗口限制 | 7 长任务稳定性差 |
|---|---|---|---|---|---|---|
| 例如:公司内部知识库, 邮件, 合同, 用户数据, CRM | 例如:发送邮件, 创建日历, 创建Jira, 调用数据库, 支付, 部署代码 | ChatGPT 默认是无状态。不会记住:用户是谁, 历史行为, 偏好, 长期目标 | LLM虽然能推理,但:不稳定, 容易遗漏步骤, 不会自我纠错 | LLM有:Hallucination | 例如:1000k tokens, 超出就丢失。 | 例如:100步任务.容易:忘记步骤, 偏离目标 |
| 解决方案:RAG系统 | 解决方案:Function Tool | 解决方案:Memory system | 解决方案:Agent系统 | 解决方案:tool verification, retrieval grounding, rule engine | 解决方案:chunk, retrieval | 解决方案:Agent loop。 |
三、ChatGPT 不适合做的事情
| 1 精确计算 | 2 数据库查询 | 3 大规模数据处理 |
|---|---|---|
| 例如:金融计算, 统计, 科学计算 | 例如:LLM生成SQL, 数据库执行。 | 例如:100万条数据 |