这是一篇由原始材料转换而来的阅读页,保留了源文件的主要结构,并补充了可追溯的来源说明与链接。

摘要

清晰目标 明确边界 可见状态 可审计结果 可撤销后果

autoresearchmarkdownarticle

Philosophy

一、Autonomy is earned, not assumed

自治不是默认授予的。 自治必须建立在:

  • 清晰目标
  • 明确边界
  • 可见状态
  • 可审计结果
  • 可撤销后果

没有这些前提,所谓自治只是不可控执行。

二、 Constraints create useful intelligence

有价值的 agent,不是因为它无所不能, 而是因为它在约束中仍能持续产出有效增量。

约束不是能力的对立面, 而是能力得以沉淀和验证的前提。

三、 Evaluation is part of the system, not an afterthought

评估不是最后补上的环节。 评估规则决定了系统会学成什么样。

一个没有稳定评估的 autoresearch 系统, 最终优化的不是目标, 而是噪声、偶然性、或作弊路径。

四、 Logging is memory for organizations

没有日志的实验,不是资产,只是经历。

日志的价值不只是“记录发生过什么”, 而是让后续 agent 或人类能够:

  • 判断趋势
  • 识别失败模式
  • 重用成功策略
  • 减少重复试错

五、 Reversion is a feature, not a failure

回滚不是失败。 回滚是把失败安全地关进历史里, 让系统仍能继续前进。

一个不会优雅回滚的 agent, 不适合进行持续实验。

六、 Simplicity compounds

复杂性会上瘾,也会积累债务。

在 autoresearch 中, 如果两个方案收益接近,应优先选择:

  • 更简单
  • 更可解释
  • 更稳定
  • 更容易继续迭代

七、 Human judgment moves upstream

人的角色不会消失, 但会从“执行每一步”上移到:

  • 定义目标
  • 选择指标
  • 设计边界
  • 制定 policy
  • 审核方向

这意味着最重要的人类工作, 不再只是写代码, 而是设计 agent 赖以工作的制度。

八、 The true artifact is the research loop

单次实验结果当然重要。 但更重要的产物是:

  • 这个 loop 是否可持续
  • 是否能重复产生有效增量
  • 是否能在无人盯守时安全运行
  • 是否能把经验沉淀为结构

因此,autoresearch 的真正作品, 不是某次偶然成功, 而是一个越来越成熟的研究循环。

来源与参考

源文件: autoresearch/PHILOSOPHY.md

来源目录: /srv/project/harness-engineering

继续阅读