OpenClaw稳态输出实践:评审回路与长期记忆插件

这一组聚焦 OpenClaw 的“稳定输出”:先做结果质检,再把长期记忆补上。适合已经在日常使用 OpenClaw、但遇到回答漂移、前后不一致、上下文丢失的团队。

1) autocouncil

  • 项目地址:GitHub - shadmau/autocouncil: Self-improvement loops for OpenClaw agents via multi-LLM review · GitHub
  • 开源依据:代码开源在 GitHub(公开仓库,Show HN 说明仓库约255行,便于审计与二次改造):GitHub - shadmau/autocouncil: Self-improvement loops for OpenClaw agents via multi-LLM review · GitHub
  • 解决什么问题:OpenClaw 在执行前后缺少“第二道闸门”时,容易把质量一般的计划或输出直接发送到下游(用户、工单、自动化任务)。autocouncil 用 PASS/REVISE/BLOCK 给出可执行的质量门控。
  • 核心能力:
    • 对计划或最终输出做多模型复审(1-3个LLM)
    • 返回结构化裁决:PASS / REVISE / BLOCK
    • 支持“不过关就重写再审”的循环
    • 适合放在高风险动作前(如批量改动、外发消息、自动执行)
    • 仓库小、逻辑集中,便于按团队标准扩展评分规则
  • 快速上手(建议路径):
    1. 克隆仓库并阅读 README,先跑最小示例确认本地可执行
    2. 先只接入一个低风险场景(例如:对外回复前复审)
    3. 定义你自己的阻断条件(例如包含未验证结论即 BLOCK)
    4. 把复审步骤接入 OpenClaw 的执行链路(执行前审计划、执行后审结果)
    5. 记录一周 PASS/REVISE/BLOCK 比例,再调整阈值
  • 最适合谁:需要把 OpenClaw 用在真实生产流程(外发、自动执行、批量处理)并希望降低误判成本的个人开发者与小团队
  • 局限与注意:它是“质量闸门”,不是事实真相引擎;如果评审模型本身有盲区,仍可能误判。多模型复审也会带来额外时延与成本。
  • 与 OpenClaw 结合点:可作为 OpenClaw 的前后置校验环节:1)任务执行前审计划;2)任务完成后审输出;3)REVISE 时让 OpenClaw自动修订并回环;4)BLOCK 时要求人工确认再继续。与 cron 定时任务、subagent 产出验收流程都可组合。
  • 参考链接:

2) openclaw-engram

如果你只先上一个:优先上 autocouncil 把风险降下来;一旦流程稳定,再加 openclaw-engram 把长期复用做起来。