搞了二十年研发,我看这“AI工程闭环”又是新瓶装旧酒

蚂蚁那篇讲Harness搞AI写代码工程闭环的,核心不就还是那套老东西吗?需求、开发、测试、部署、验收,换了个AI生成代码的输入源,后面那些流程管控、质量卡点、流水线集成,我看跟我们十几年前推敏捷、搞CI/CD时候琢磨的没啥本质区别。

我做这行那会儿,最早用代码生成工具,后来搞低代码平台,每次新技术出来都有人嚷嚷“颠覆流程”。结果呢?最后发现工具再花哨,你工程上该有的步骤一个也省不了。AI写的代码就不用单元测试了?就不用Code Review了?部署上线就能闭着眼睛点了?想当年我们为了一个编译脚本的权限管控都能吵半个月,现在指望AI把脏活累活全包了,太天真。

他们提的“从生成到验收的闭环”,思路是对的,承认了AI只是个工具,不是魔法。但具体做法,无非是把AI生成物当成一个特殊分支来源,在现有的研发流水线里多加几个质量门禁和人工确认环节。这本质上是对“不确定输入源”的管控加强,我们当年对接外包团队、实习生写的代码,不也搞类似的一套吗?见得多了。

所以我看,这股AI编程的热潮,最终还是会沉淀到工程实践和流程工具的改良上,热闹一阵子,该踩的坑一个不会少,只是这次换AI来踩了。未来一两年,估计会有更多这种“AI+现有流水线”的缝合怪方案出来,直到大家发现,最费劲的其实不是让AI写代码,而是让它写的代码能符合你那一大堆陈年旧规和奇葩业务逻辑。

这东西就那样,用过就知道天花板在哪。

小白问一下,验收标准具体是些什么指标啊?是不是跑通测试就行?不太确定。

mark一下,回头学习。

又来这种帖子了,标题起得天花乱坠,什么“闭环”、“验收”,到最后是不是又变成手动给AI擦屁股的流程?我反正不信能完全自动化。

你们提到的“把代码生成、评审、测试串起来”具体是怎么落地的?是用了Harness的什么特定功能,还是自己写了好多胶水脚本?评审环节AI生成的代码谁来审,标准跟人写的代码一样吗?我们团队也在尝试,卡在评审这里了。

我们团队也试过类似的,流程设计得挺美好,但实际跑起来发现,AI生成的代码风格不一致是个大问题。后来我们定了条死规矩,所有AI生成的代码必须过一个强制格式化工具,并且要求生成时附带单元测试的骨架,这样至少验收的时候有个基础保障。不过最大的坑其实是人的惯性,很多老鸟不愿意把评审精力花在“机器写的”代码上,觉得不如自己重写快,这个心态关比技术关还难

不只是跑通测试,得加上代码评审和回归用例,光绿灯骗不了人

闭环这词喊得响,落地多半还是半自动

光跑通测试不够,还得看覆盖率和边界用例

完全自动化目前不现实,验收这环还是离不开人

能验收这点是关键,不然写得再快也是一堆没人敢合的代码

能把验收标准固化下来,已经比纯手撸强很多了

验收光跑通测试不够,覆盖率和回归用例都得卡住