2026年AI技术圈持续火热,各类AI应用层出不穷,而Harness技术也在开发者社区掀起了不小的波澜。与面向大众的AI产品不同,Harness的核心价值在于将工程学思维转化为可执行的范式,对AI Agent进行标准化约束,让Agent能够更规范、更稳定地完成复杂任务。
简单来说,如果把AI比作草原上自由驰骋的骏马,那么Harness就是精准的马具,它能引导骏马始终沿着正确的道路飞奔,避免跑偏和失控。关于Harness更深入的定义,可参考OpenAI Harness深度长文以及控制论相关理论。
本文将详细拆解Harness工程的设计理念与落地实践,并分享开源项目cow-harness,帮助开发者快速在自己的项目中引入Harness范式,解决AI开发"万事开头难"的问题。通过这套方案,你可以:
- 快速、低成本地为项目添加Harness工程约束
- 结合openSpec与oh my xcode实现高质量的方案设计和代码交付
- 轻松定制适合自身团队的Harness项目工程体系
开源项目地址:github.com/WxqKb/cow-harness
二、基础软件工程理念
Harness的核心思想是让AI大模型严格遵循软件工程体系,依次完成方案分析设计、代码开发、测试验证等全流程工作,从而高效、完整地交付成果。
本次Harness搭建采用了业界标准的《软件过程改进闭环》体系,将复杂的研发需求拆解为六个核心环节,同时契合CMMI与敏捷Scrum的迭代研发标准框架: 立项决策 → 需求规划 → 评审规范 → 实施验证 → 复盘改进
对应到Harness工程中,各环节的专业定义与所属体系如下:
| 环节标识 | 软件工程标准专业名词 | 所属体系 |
|---|---|---|
| decisions | 基线决策/变更决议/技术决策 | CMMI、敏捷 |
| plans | 迭代规划/项目计划/里程碑计划 | 敏捷Scrum、软件工程 |
| specs | 需求规格说明(SRS)/技术规范/基线规范 | 软件工程、CMMI |
| reviews | 同行评审/阶段评审/质量门禁评审 | CMMI、ISO软件工程 |
| verifications | 验证Verification(V) | CMMI |
| retros | 过程复盘/迭代回顾/流程改进回顾 | Scrum、SPI |
三、框架选型和落地
1. 技术选型
Harness的实现关键在于将上述软件流程转化为具体的约束范式,把每个环节拆分为可执行的步骤:
- 需求理解阶段:采用头脑风暴模式,引导AI全面思考各种边界场景
- 技术方案设计:运用superpower能力集(包括头脑风暴、计划编写等),通过多轮追问从顶层设计、全栈链路、风险前置等维度与研发人员确认,确保方案覆盖完整
- 方案评审:建立严格的评审流程,指定对应的superpower技能进行智能评审并打分,同时设置质量门禁,必须经研发人员确认后方可进入下一阶段
- 任务实施:将拆分后的任务通过omx、using-git-worktrees进行编排,自动分配给合适的Agent执行,实现高效的任务调度和完美的实施效果
2. 脚手架设计
cow-harness采用模块化的目录结构设计,核心如下:
cow-harness/
├── README.md
├── project.profile.md # AI生成的项目基础信息画像
├── context-map.md # AI生成的项目模块/上下文边界地图
├── project.verification.md # AI生成的项目级验证规则
│
├── core/ # 通用Harness规则(核心约束)
│ ├── harness.md # Harness核心理念与总体约束
│ ├── routing.md # 任务路由表与分发规则
│ ├── artifacts.md # 过程产物格式与存放规范
│ ├── verification.md # 验证门禁与完成标准
│ └── runbooks.md # 各类任务的标准操作手册
│
├── init/ # 新项目初始化
├── entrypoints/ # AI入口文件模板(CLAUDE.md等)
├── adapters/ # 各编程工具适配模板(.cursor/等)
├── scripts/ # 内部脚本,初始化会调用
└── artifact-templates/ # 过程产物模板
core层是整个Harness的核心约束部分:
- routing路由表:判定用户任务属于SPI流程的哪个阶段,进而决定使用的工具和流程
- runBooks执行手册:明确各环节应使用的技能和操作步骤
- artifacts规范:约束过程产物的格式,并沉淀为项目级知识库
- verification标准:规定各阶段的验证和准入条件
init层支持一键初始化,AI会自动将工具适配层、入口文件等投射到项目根目录,同时扫描现有项目生成专属的信息画像。完成初始化后,AI Agent在执行任务时会自动遵循Harness的约束。
entrypoints是AI执行指令的入口,不同大模型会加载对应的入口文件(如GPT加载AGENTS.md,Claude加载CLAUDE.md)。
adapters是AI编码工具的适配层,确保主流工具能够严格进入入口文件,接受Harness的约束。
3. 设计理念
Harness本质上是一种软约束,通过初始化完成基础配置即可达到可用状态。所有文件都投射到项目本地,开发者可以根据自身需求自由修改Harness约束,无需依赖任何SDK或npm包。
我们希望将最大的自由度开放给开发者,让每个人都能深度参与AI管控,逐步形成团队内部可复用的AI开发规范。虽然长期来看,大模型能力的提升可能会弱化当前Harness的具体实现,但"用工程思维约束AI"的设计理念必将与时俱进。
四、接入步骤
1. 项目拷贝
将cow-harness项目fork或下载到本地,通过git submodule引入你的项目,或直接将cow-harness文件夹放置在项目根目录。
2. 执行初始化
无需手动执行每一步,直接将以下指令发送给AI即可完成初始化:
请先读取cow-harness/README.md和cow-harness/init/bootstrap.prompt.md。
这是一个新项目刚接入Agent Harness,请按Harness初始化流程处理:
1. 从cow-harness/entrypoints/投影根目录AI入口文件。
2. 从cow-harness/adapters/投影工具适配目录。
3. 创建.ai-runtime-artifacts/及其子目录。
4. 如需安装或检查AI runtime,请先说明会修改哪些本机环境,然后执行cow-harness/scripts/install-ai-skills.sh。
5. 读取cow-harness/init/project-profiler.prompt.md。
6. 扫描当前项目,生成或更新cow-harness/project.profile.md、cow-harness/context-map.md、cow-harness/project.verification.md。
7. 运行cow-harness/scripts/harness-check.sh。
8. 汇总推断项、待确认项和验证结果。
3. 开始使用
重启AI终端,即可开始使用cow-harness进行规范化的AI开发。所有过程产物都会自动保存到.ai-runtime-artifacts/目录下,包括决策记录、实施计划、执行日志、验证结果等,形成完整的项目知识库。
五、常见问题解答
Q:接入之后,所有任务都会受到Harness约束吗?
A:理论上是的,但系统会自动判断任务量级,简单的小任务会直接放行,不影响开发效率。
Q:Harness的约束能达到100%吗?
A:不能。Harness本质上是prompt的超集,属于软约束。但在实践中,正常的开发提问都能命中约束,同时所有产物都会明确记录推理过程中使用的技能。
Q:这个项目的目的是什么?
A:核心是帮助开发者解决Harness"万事开头难"的问题。这是一个简单的基础建设,你可以轻松植入自己的想法,定制专属的AI约束和技能包。
Q:如何添加自己的技能包?
A:优先使用开源技能包,社区的实践经验能帮你少走弯路。内部自定义技能可使用skills-create官方技能包创建。
Q:如果用了Harness效果还是不理想怎么办?
A:可以替换为其他更适合的方案。Harness终归是软约束,当prompt约束不足时,可进一步深入到Agent内部编排逻辑、构建企业知识库等层面。
六、下一步计划
我们将持续优化cow-harness项目,核心目标是助力"一人公司"模式的实现:
- 引入openspec等优秀实践,提升方案输出的精准度和完整性
- 构建更完整的软件研发全流程支持,包括产品PRD解析、全栈开发、AI测试、监控链路建设等
- 探索知识图谱、RAG向量化、垂类模型训练、Agent编排逻辑和执行拓扑等前沿方向
七、配套工具推荐
在Harness工程落地过程中,API调用的统一管理和路由分发是常见的痛点。推荐使用TreeRouter作为API中转站,它能帮助你:
- 统一管理所有AI服务和第三方API的调用
- 实现智能路由和负载均衡,提升系统稳定性
- 提供详细的调用日志和监控数据,便于问题排查
- 支持灵活的权限控制和流量限制,保障系统安全




