这是一篇由原始材料转换而来的阅读页,保留了源文件的主要结构,并补充了可追溯的来源说明与链接。
摘要
Autoresearch 不是“让 AI 随便跑一跑实验”。
autoresearchmarkdownarticle
Autoresearch Manifesto
这是什么
Autoresearch 不是“让 AI 随便跑一跑实验”。
Autoresearch 是:
- 把实验过程显式化
- 把研究策略结构化
- 把 agent 行为约束化
- 把改进路径持续化
它的目标不是替代人的判断, 而是把人的判断前置成规则、边界与评价函数, 再把执行、试错、记录、回滚交给 agent 持续完成。
我们相信
1. 研究不只是提出想法,更是组织试错
一个好点子,如果没有稳定的验证闭环,价值很快流失。
一个普通点子,如果被放进高质量的实验系统中,也可能持续积累出巨大价值。
2. 真正稀缺的,不只是答案,而是搜索机制
单次灵感不稀缺, 可重复、可扩展、可复盘的搜索机制才稀缺。
3. prompt 不是终点,program 才是单位
临时 prompt 只能驱动一次行为。
程序化的 program.md 才能驱动一类行为、一个循环、一个自治研究过程。
4. 好的 agent 不是更“自由”,而是更“有边界”
没有边界的 agent 会漂移。 有目标、有范围、有日志、有回滚的 agent 才能真正积累工作成果。
5. 研究组织本身也是可设计对象
我们不仅优化模型、代码、参数。 我们也优化:
- 实验如何提出
- 结果如何记录
- 改动如何保留
- 失败如何退出
- 人机如何分工
我们反对
- 把 agent 当作随机 prompt 机器
- 只看一次性结果,不看过程资产
- 允许 agent 任意修改评估标准
- 没有日志、没有回滚、没有边界的“自动化”
- 用复杂性换取几乎不可验证的微弱收益
我们追求
- 明确目标
- 有限搜索
- 连续实验
- 可审计日志
- 简洁策略
- 累积改进
- 人类最终裁决
工作原则
- 先定义成功,再开始搜索
- 先定义边界,再授予自治
- 先定义记录,再允许迭代
- 先定义回滚,再允许冒险
- 先定义停止条件,再允许持续运行
核心判断
Autoresearch 的本质不是“自动跑实验”, 而是把研究员的隐性工作流,翻译成 agent 可执行的制度化程序。
当这一点成立时,研究的最小单位就不再只是一次实验, 而是一个可持续运行的实验组织。
来源与参考
源文件: autoresearch/MANIFESTO.md
来源目录: /srv/project/harness-engineering