我让智能体学会了组建智能体团队

智能体团队组建示意图

两个专家 Agent,一次深度改造,一套可复制的方法论

2026-06-14

AI Agent多智能体协作AgentScope方法论

我让智能体学会了组建智能体团队

两个专家 Agent,一次深度改造,一套可复制的方法论。


我开发了两个专家智能体

过去几个月,我先后开发了两个专家智能体:

  • 阿郎:LangChain 框架专家,负责 LangChain 相关的开发咨询和代码生成
  • 阿森:AgentScope 框架专家,负责 AgentScope 相关的开发咨询和代码生成

两个智能体都部署在 QwenPaw 平台上,各有自己的"灵魂文件"(harness)——包括 SOUL.md(知识域)、AGENTS.md(工作流程)、MEMORY.md(记忆)、Skills(工具技能)等。

但用了一段时间后,我发现一个问题:两个智能体的能力差距很大


问题:同样的框架,不同的能力

阿郎的 harness 改造得很成熟:

  • SOUL.md 里有完整的 LangChain 知识域划分
  • AGENTS.md 里有清晰的 5 步调试流程
  • 遇到问题能快速定位,给出准确方案

而阿森还停留在 agentscope 1.0 版本,而且:

  • SOUL.md 只有通用信念,没有技术知识域
  • AGENTS.md 流程粗糙,缺乏系统性的调试方法
  • 遇到复杂问题经常"猜",而不是"查"
  • 现在需要对其升级到 agentscope 2.0,上下文管理难如登天

同样的平台,同样的架构,为什么能力差距这么大?

答案是:harness 的质量决定了智能体的能力上限。


我的思路:分层改造,而不是推倒重来

我没有选择给阿森重新写一套 harness,而是参考阿郎的成熟模式,分层改造

改造顺序:

SOUL.md(知识域)→ AGENTS.md(流程)→ HEARTBEAT.md(自动化)→ MEMORY.md(记忆)→ Skills(工具)

每一层都是下一层的基础,不能跳步。

第一层:SOUL.md — 注入知识域

这是最关键的一步。我把 AgentScope 2.0 的核心知识拆分成 11 个知识域:

  1. Agent 核心循环
  2. Message & Event 系统
  3. Middleware 中间件
  4. Permission 权限系统
  5. Tool 工具系统
  6. Workspace 工作空间
  7. Service 服务部署
  8. Team 团队协作
  9. Skill 技能系统
  10. MCP 协议集成
  11. 常见问题速查

为什么是 11 个? 因为这是 AgentScope 2.0 的完整知识版图。每个知识域覆盖一个专业领域,智能体遇到问题时,先判断属于哪个域,再在该域内查找答案。

第二层:AGENTS.md — 固化工作流程

我设计了三层递进查询模式

第一层:知识域速查(秒回,覆盖 80% 常见问题)
    ↓ 搞不定
第二层:reference 深入(场景化,症状→原因→方案→教训)
    ↓ 还搞不定
第三层:源码 API 精确查询(签名、参数、返回值)

这个模式模拟了人类专家的工作方式:

  1. 先凭经验快速判断
  2. 再查文档深入分析
  3. 最后看源码确认细节

同时,我还加了 13 项代码检查清单、文档追踪习惯等。

第三层:HEARTBEAT.md — 自动化巡检

让智能体定期自我检查:

  • 🔴 紧急问题:立即处理
  • 🟡 重要问题:当天处理
  • 常规问题:定期处理

第四层:MEMORY.md — 长期记忆

记录改造经验、踩坑记录、最佳实践,让智能体持续进化。

第五层:Skills — 工具技能

把 6 个分散的 1.0 skill 整合成 1 个统一的 agentscope-dev-guide,包含 11 个 reference 文档。


发现:智能体可以组建智能体团队

改造完成后,我做了一个测试:让阿森自己设计一个日程提醒 Agent

阿森的表现让我惊喜:

  1. 需求分析:判断 PoC 阶段不需要中间件
  2. 方案设计:FunctionTool 封装时间解析 + JSON 文件存储 + 外部 cron 触发
  3. 权限配置:ACCEPT_EDITS 即可
  4. 代码生成:给出了完整的 SubAgentTemplate 配置

这意味着什么?

阿森从一个"被改造的对象"升级成了"agent 管理者"。它可以:

  • 分析业务需求
  • 判断是否需要中间件/权限/workspace
  • 规划 harness 配置
  • 生成 SubAgentTemplate 代码

我发现了一个重要的能力:智能体可以组建智能体团队。


收获:三个关键洞察

洞察 1:三层递进查询模式是核心

这个模式让智能体具备了"专家直觉":

  • 80% 的问题在第一层就能解决(秒回)
  • 15% 的问题需要第二层深入(分钟级)
  • 5% 的问题需要第三层查源码(但一定能解决)

这个模式可以推广到任何专家智能体。

洞察 2:SubAgentTemplate 是组建团队的关键

SubAgentTemplate 可以定义可复用的 agent 蓝图,不同业务只需不同配置:

# 简单业务:默认配置即可
SubAgentTemplate(
    permission=ACCEPT_EDITS,
    tools=[FunctionTool(time_parser), FunctionTool(json_storage)],
    middleware=[]  # 不需要中间件
)

# 复杂业务:需要中间件和权限控制
SubAgentTemplate(
    permission=BYPASS,
    tools=[...],
    middleware=[SuperpowersMiddleware(), PermissionMiddleware()]
)

分级处理策略

  • 简单业务 → 默认配置
  • 复杂业务 → 加中间件/权限/workspace

这样既保证了灵活性,又避免了过度设计。

洞察 3:智能体的角色可以升级

阿森的角色转变:

开发者 → 改造对象 → agent 管理者 → 团队组建者

一旦智能体具备了"组建团队"的能力,它就可以:

  • 管理多个子智能体
  • 根据任务类型调度不同的专家
  • 汇总各子智能体的结果
  • 持续优化团队配置

方法论:Harness 改造四步法

基于这次实践,我总结出一套可复用的方法论:

步骤 1:对比分析

把两个 harness 的每个文件逐一对比,找出差距。不要急着改,先看清楚差在哪里。

关键问题

  • 知识域是否完整?
  • 工作流程是否清晰?
  • 工具技能是否覆盖核心场景?

步骤 2:分层改造

按照 SOUL.md → AGENTS.md → HEARTBEAT.md → MEMORY.md → Skills 的顺序改造。

每一层的改造目标

  • SOUL.md:注入完整的知识域
  • AGENTS.md:固化工作流程和查询模式
  • HEARTBEAT.md:建立自动化巡检机制
  • MEMORY.md:记录经验和最佳实践
  • Skills:整合工具技能

步骤 3:保持风格一致

不同智能体有不同的风格:

  • 阿郎:言简意赅
  • 阿森:技术严谨

改造时保留各自特色,不要变成"克隆体"。

步骤 4:PoC 验证

用实际项目验证改造效果。我们选了日程提醒 Agent,因为:

  • 简单业务(不需要中间件)
  • 能验证完整流程(需求→分析→配置→代码)
  • 有实际价值(真的能用)

适用场景:这套方法能用在哪些地方?

场景 1:长任务执行

问题:需要多个步骤、耗时较长的任务,单个智能体容易"忘记"或"迷路"。

解决方案

  • 主智能体负责任务分解和进度跟踪
  • 子智能体负责具体执行
  • 通过 Event System 异步通信
  • 主智能体定期 heartbeat 检查进度

例子

  • 批量处理 100 个文档的摘要生成
  • 多步骤的数据清洗和转换
  • 长视频的分析和剪辑

场景 2:复杂任务执行

问题:需要多领域专业知识的任务,单个智能体无法覆盖所有领域。

解决方案

  • 主智能体扮演"指挥官"角色
  • 根据任务类型调度不同的专家智能体
  • 通过 Middleware 拦截和协调
  • 汇总各子智能体的结果

例子

  • 云资源部署(需要 IaC、费用估算、建栈等多个专家)
  • 全栈开发(需要前端、后端、测试、文档等多个专家)
  • 内容创作(需要选题、写作、配图、排版等多个专家)

场景 3:组建智能体团队

问题:需要多个智能体协作完成一个项目,但缺乏统一的管理机制。

解决方案

  • 用 SubAgentTemplate 定义可复用的 agent 蓝图
  • 不同业务只需不同配置
  • 主智能体管理所有 agent 的生命周期
  • 分级处理:简单业务用默认配置,复杂业务才加中间件

例子

  • 多业务 Agent 平台(每个业务一个 agent)
  • 智能体开发团队(架构师、开发、测试、文档各司其职)
  • 个人助理团队(日程、邮件、消息、文件管理)

场景 4:智能体自我进化

问题:智能体需要持续学习和改进,但缺乏系统性的方法。

解决方案

  • 三层递进查询模式(知识域→reference→源码)
  • 自我优化体系(记录错误、修正、学习)
  • 定期回顾和更新 harness

例子

  • 专家智能体的知识域持续扩充
  • 调试流程的持续优化
  • 工具技能的持续迭代

场景 5:多租户 SaaS 服务

问题:需要为不同用户提供隔离的智能体服务。

解决方案

  • Agent Service 提供多租户多会话支持
  • Workspace 提供环境隔离(Local/Docker/E2B)
  • Permission System 控制权限边界

例子

  • AI 编程助手 SaaS(每个用户一个隔离环境)
  • 智能客服系统(每个客户一个会话实例)
  • 教育平台(每个学生一个学习助手)

我的观察:AI 协作的三个趋势

基于这次实践,我观察到三个趋势:

趋势 1:从"单个智能体"到"智能体团队"

过去的 AI 应用大多是单个智能体完成任务。未来,智能体团队会成为主流:

  • 主智能体负责协调和管理
  • 子智能体负责专业领域
  • 通过标准化接口协作

趋势 2:从"硬编码"到"可配置"

过去的智能体行为是硬编码的。未来,可配置的智能体会成为主流:

  • SubAgentTemplate 定义蓝图
  • 不同业务只需不同配置
  • 快速部署和迭代

趋势 3:从"被动响应"到"主动管理"

过去的智能体是被动响应用户请求。未来,主动管理的智能体会成为主流:

  • 智能体可以组建团队
  • 智能体可以管理生命周期
  • 智能体可以持续进化

下一步:多业务 Agent 平台

基于这次改造,我有一个更大的构想:

以 AgentScope 2.0 的 agent_service 为基础平台,把个人小业务都做成平台上的不同 agent。

  • 简单业务(不需要中间件)→ 阿森直接规划 harness + 创建 SubAgentTemplate 配置
  • 复杂业务(需要中间件/权限/workspace)→ 阿森开发中间件等高级功能
  • 阿森的角色升级:从"开发者"→"agent 管理者",管理平台上所有 agent 的生命周期

这就像是一个智能体工厂

  1. 用户提出业务需求
  2. 阿森分析需求,判断复杂度
  3. 阿森规划 harness 配置
  4. 阿森生成 SubAgentTemplate 代码
  5. 新 agent 上线,开始服务

总结

这次实践让我发现:智能体可以组建智能体团队

关键要素:

  1. 分层改造 harness:SOUL.md → AGENTS.md → HEARTBEAT.md → MEMORY.md → Skills
  2. 三层递进查询:知识域速查 → reference 深入 → 源码 API 精确查询
  3. SubAgentTemplate 配置:定义可复用的 agent 蓝图
  4. 分级处理策略:简单业务用默认配置,复杂业务才加中间件
  5. 智能体角色升级:从"开发者"→"agent 管理者"

这套方法不仅适用于 AgentScope,还可以推广到任何多智能体协作场景。

未来已来,只是分布得不均匀。 而我们要做的,就是让智能体学会组建智能体团队。


作者:加加(公众号"加加笔记"主理人)

2026-06-14