Skip to content

第六章 OmO Agent 体系

← 返回目录 | 上一章:OmO 插件架构 | 下一章:OmO 后台任务系统 →


6.1 设计哲学:从"一人干所有"到"专人专事"

Opencode 原生的 Agent 模型是通才型——build Agent 什么都做,general 子 Agent 也什么都做。这种设计在简单任务上足够好,但在复杂项目中有明显缺陷:

  • 一个 Agent 既要规划又要执行,容易在执行中偏离计划
  • 没有"第二双眼睛"来审查决策
  • 所有任务使用同一个模型,不能按需选择性价比最优的模型

OmO 的解决方案是构建一个分工明确的 Agent 团队,每个 Agent 有:

  • 明确的职责边界
  • 专属的 LLM 模型(按任务特性选择最优模型)
  • 受限的工具权限(最小权限原则)
  • 定制的系统提示词(领域专家级指令)

6.2 完整 Agent 清单

第一梯队:主编排层

Agent模型模式角色定位
Sisyphusclaude-opus-4-6 (max reasoning)all主编排器——接收用户请求,分析意图,分派任务,验证结果
Atlasclaude-sonnet-4-6primaryTodo 编排器——在 Sisyphus 不可用时管理任务续航

Sisyphus(西西弗斯)是整个系统的"大脑"。它的名字来源于希腊神话——每天推石上山的人。寓意是:AI Agent 每天也在重复执行任务,但和人类一样,这并不使工作没有价值。

Sisyphus 的核心行为模式:

  1. 意图识别:收到用户请求后,先分类(研究/实现/调查/评估/修复/开放式)
  2. 路由决策:根据意图类型选择直接执行、委派子 Agent、还是先探索
  3. 并行调度:将独立的探索任务同时发给多个子 Agent
  4. 结果验证:子 Agent 完成后,检查结果是否符合预期
  5. 质量保证:运行 LSP 诊断、构建命令、测试来验证代码变更

第二梯队:执行层

Agent模型模式角色定位
Sisyphus-Juniorclaude-sonnet-4-6all分类执行器——根据 category 承接具体开发任务
Hephaestusgpt-5.4 (medium reasoning)all深度自主工作者——处理需要深入研究后实现的复杂任务

Sisyphus-Junior 是 Category 系统的执行者。当 Sisyphus 委派一个带有 category 的任务时,Junior 作为后台子 Agent 使用该 category 对应的模型和 Skill 来执行。

Hephaestus(赫菲斯托斯,希腊锻造之神)专门处理需要自主研究+端到端实现的"硬活"。它的特点是:先充分理解问题,再动手实现。

第三梯队:顾问层(只读)

Agent模型模式角色定位
Oraclegpt-5.4 (high reasoning)subagent架构顾问——只读、高成本、高质量的推理模型,用于复杂架构决策和深度调试
Metisclaude-opus-4-6 (max reasoning)subagent预规划顾问——分析任务需求,识别隐藏意图、歧义和 AI 失败点
Momusgpt-5.4 (xhigh reasoning)subagent计划审查员——以严格标准评估工作计划的清晰度、可验证性和完整性

Oracle 是系统中最"贵"的 Agent,使用最高推理能力的模型。它只在以下场景被调用:

  • 复杂架构设计需要权衡多系统的 tradeoff
  • 修 Bug 失败两次以上
  • 安全/性能方面的关键决策

MetisMomus 形成了一个"计划审查流水线":

用户需求 → Metis(分析需求、找漏洞)→ Prometheus(制定计划)→ Momus(审查计划质量)→ 执行

第四梯队:侦察层

Agent模型模式角色定位
Exploregrok-code-fast-1subagent代码库搜索——快速、廉价的内部代码搜索
Librarianminimax-m2.7subagent外部文档搜索——查询官方文档、OSS 实现、最佳实践
Multimodal-Lookergpt-5.3-codexsubagent多模态分析——PDF/图片/截图内容提取

ExploreLibrarian 是 Sisyphus 最常用的"侦察兵"。它们的设计理念是"grep 而非顾问"——快速搜索、返回原始结果,不做过多解读。Sisyphus 在分析用户请求时,通常会同时发射 2-5 个 Explore/Librarian 后台任务,并行搜索不同维度的信息。

第五梯队:内部特殊用途

Agent模型用途
Prometheusclaude-opus-4-6 (max)战略规划器——生成详细的工作计划文件

Prometheus(普罗米修斯)不直接与用户交互,而是一个内部规划引擎。它生成的计划文件保存到 .sisyphus/plans/ 目录,然后由 Momus 审查,最终由 Sisyphus 或 Junior 执行。

6.3 模型选择策略

OmO 的模型分配体现了成本-质量平衡

高成本 / 高质量          低成本 / 高速度
    ◄─────────────────────────────────►
Oracle (gpt-5.4 xhigh)
Momus (gpt-5.4 xhigh)
Sisyphus (opus max)
Prometheus (opus max)
Metis (opus max)
    Hephaestus (gpt-5.4 medium)
    Junior (sonnet-4-6)
    Atlas (sonnet-4-6)
        Multimodal-Looker (gpt-5.3-codex)
            Librarian (minimax-m2.7)
                Explore (grok-code-fast-1)  ← 最便宜、最快

这个分配逻辑是:

  • 搜索类任务(Explore、Librarian)使用最便宜的模型,因为它们本质上是"智能 grep"
  • 执行类任务(Junior、Hephaestus)使用中等模型,需要足够的代码生成能力
  • 决策类任务(Oracle、Momus、Metis)使用最贵的模型,因为决策错误的代价远高于执行错误

← 返回目录 | 上一章:OmO 插件架构 | 下一章:OmO 后台任务系统 →