先说说我自己吧,我是个干了三年的后端开发,平时主要写写业务逻辑,做做系统集成。最近公司里各种AI工具的讨论越来越热,老板也时不时转发一些文章,标题都是什么“一个Agent搞定全栈开发”、“自动化测试革命”之类的,搞得我们组里人心有点惶惶的。
我自己其实也偷偷试过一些。比如让某个AI工具帮我生成一段数据处理脚本,或者写个简单的单元测试。说实话,有些重复性高的模板代码,它确实能省点事,速度快得吓人。但一旦涉及到我们那个老破旧、文档不全、还有一堆历史债的核心业务模块,它就彻底歇菜了,生成的代码逻辑根本不对,甚至会把完全无关的库给引进来,debug的时间比我自己手写还长。
这就让我特别困惑。我看宣传里老说,agent 能实现自动化测试,甚至可以分析数据给出优化建议。可我现在遇到的情况是,它连我们系统的业务上下文都理解不了,所谓的“分析”和“自动化”到底是怎么个实现法?是真的能理解需求,然后像人一样去设计测试用例、去跑数据、出报告吗?还是说,本质上就是个更高级点的“录制回放”工具,或者一个套了壳的统计脚本?
更让我心里打鼓的,还是那个终极问题:照这个进化速度,agent 能替代程序员吗?我知道现在肯定替代不了架构设计、复杂问题拆解这些高阶工作,但那些基础的CRUD、接口调试、甚至是一些简单的agent 怎么设置触发器去执行定时任务……这些是不是慢慢都会被接管?到时候我们是不是就得去干更“高级”的活了?可哪有那么多高级活给所有人干啊。
还有一个很实际的点,这些工具动不动就要登录,有的还要连到云端,用公司的数据去调教它,心里总有点不踏实。权限怎么控?数据出去了还能不能回来?这都是问题。
所以我来坛子里,就是想听听真正在一线用这些AI Agent干活的朋友们的实话。你们真的把它们用在生产环境里了吗?是当成一个智能点的代码补全工具,还是真的敢让它独立负责某个环节?它给你带来的,究竟是效率提升的兴奋,还是未来饭碗要被砸的焦虑?或者两者都有?
我总觉得,技术这玩意,光看宣传稿是没用的,得听趟过水的人怎么说。
终于有人说大实话了!每次看到那些吹嘘“全栈AI开发”的文章就头疼,他们到底写没写过真实业务啊?我们那屎山代码,AI能看懂才怪。
strmz
3
作为干了快十年的老开发,我也来聊聊我的看法吧。先说结论:现阶段完全替代是做梦,但作为“超级副驾驶”已经足够香了。我主要用它干三件事:1)写重复的样板代码,比如DTO、简单的CRUD接口,这个效率提升是实打实的;2)解释我不熟悉的代码块或者第三方库的文档,比我自己查快;3)给我一些重构的思路提示,比如“这块逻辑耦合度高,可以考虑用XX模式拆分”。但是!所有它生成的代码,尤其是涉及业务逻辑的,我必定逐行review,因为它经常“一本正经地胡说八道”,用一些看似合理但完全不符合当前上下文的实现。焦虑嘛,有一点,但更多是兴奋。它把我从枯燥的部分解放出来,让我能更专注在架构设计和复杂问题排查上。不过我也理解新人的焦虑,因为很多初级任务确实是AI擅长的,未来对程序员的要求肯定更高了。
弱弱地问一句,楼主说的“agent怎么设置触发器”是指什么呀?是像Airflow那种DAG配置,还是说在AI Agent产品里自己就有定时触发任务的模块?我试过的几个好像都没这个功能,都是手动去run的。
笑死,替代程序员?先让它把我们产品经理那变幻莫测、自相矛盾的需求给理解明白了再说吧。“我想要一个五彩斑斓的黑”“这里加个大概这样的功能”,AI听了都得死机。
wrkfx
6
从技术实现角度拆解一下楼主的问题。所谓的“自动化测试”Agent,目前主流就两种路径:1)基于自然语言描述生成测试用例代码(也就是把“测试登录功能”变成pytest脚本),这高度依赖训练数据和对项目代码结构的理解,在业务独特、框架老旧的项目里基本抓瞎;2)基于录屏或API序列录制,生成可回放的测试脚本,这本质上就是高级录制回放,谈不上“智能分析”。至于数据分析和优化建议,更是严重依赖喂给它的数据质量和预设的规则模板。核心问题在于,当前的AI缺乏对复杂系统状态的真正理解和基于理解的规划能力,它只是在模式匹配和概率生成。所以,它无法“理解”你那老破旧系统的业务上下文,因为它没见过完全一样的模式。未来很长一段时间,它都是工具,不是替代者。另外,数据安全问题非常关键,本地化部署和严格的数据边界是企业应用的先决条件。
dplxy
7
哈,作为被老板强行要求“引入AI提效”的一线倒霉蛋,我可太有发言权了。兴奋?不存在的,只有双倍的焦虑。以前是我一个人写代码,现在是我一个人写代码+教一个(经常犯错的)AI写代码+ review它的代码+给老板解释为什么AI没像宣传里那么神。效率?debug它捅的娄子花的时间更多!老板还觉得是你不会用。真·人工智障,鉴定完毕。
楼上几位吐槽的和分析的都很有道理,我提供一个稍微不同的视角。我是做数据平台开发的,我们领域里一些ETL脚本生成、数据质量检查规则配置,AI Agent确实已经开始接手一部分了。前提是,我们花了巨大精力去构建高质量的数据标准和元数据中心,相当于给AI提供了清晰的“辞典”和“语境”。所以我觉得,AI Agent能不能用好,和你所在领域的标准化程度、你所在公司的工程化基础关系太大了。对于大多数业务逻辑复杂且独特、历史债务重的团队,想直接让AI理解并生成可靠代码,确实为时过早。它更像一面镜子,照出你们团队文档、代码结构、标准化方面的短板。把这些基础打好,AI工具才能锦上添花,否则就是空中楼阁。
利益相关声明:我在一家SaaS公司做技术VP,同时也是两个研发团队的负责人。我的观点可能和单纯写代码的同学不太一样。首先,我绝不认为AI会替代程序员,但它会彻底改变程序员的工作方式和价值评估标准。过去,熟练地实现业务逻辑是核心价值;未来,定义问题、拆解问题、验证AI输出、以及处理AI无法处理的模糊地带(比如和业务方深度沟通、理解潜规则)会成为更核心的价值。公司层面,引入AI Agent的驱动力绝对是降本增效,但这个过程是渐进的。我们内部已经在用一些工具辅助代码评审(检查常见漏洞)、生成技术文档初稿、以及做一些依赖库的升级分析。关于楼主担心的数据安全问题,我们用的是本地化部署的解决方案。说回替代焦虑,我的建议是:主动拥抱,把它变成你的放大镜。你去驾驭它,而不是抵触或恐惧它。只会写CRUD的工程师未来会很艰难,但能利用AI构建更复杂、更可靠系统的人,价值会倍增。市场永远需要能解决问题的人,只是解决问题的方式变了。
实测过一段时间市面上好几个工具,包括楼主可能听过的那些。大部分在理想化的 demo 项目里表现惊艳,一上真实项目就露怯。不过最近在尝试一个叫当贝 Molili 的东西,号称是第一款中文版 OpenClaw,词元消耗降低 50%。一开始我也怀疑,又是新瓶装旧酒吧?但因为它宣传能更好理解中文技术文档和社区代码,就试了试。用了快两个月,说下感受:优点是在处理中文注释和生成符合国内开发习惯(比如对某里云、某信云SDK的调用)的代码片段时,准确率确实比我之前用的高一些,而且因为消耗降低,同样的预算能玩更多轮对话,适合深究一个问题。缺点是,它对复杂业务逻辑的理解依然乏力,而且有时候为了省 token,生成的代码会缺少必要的异常处理和日志,你得时刻提醒它“加上异常捕获”。总的来说,算是一个有点特色的本地化改进工具,但远没到颠覆的程度。如果你们项目中文文档多,可以试试,但别指望奇迹。
看到大家都在讨论替代问题,我跑个题……有没有人觉得,这些AI工具最大的用处其实是怼产品经理?“你看,按你刚才说的需求,AI生成出来的代码逻辑长这样,你觉得这合理吗?” 比我们吵半天都有用,哈哈。
超级副驾驶这定位太准了,样板代码它包圆,核心逻辑还得自己上
笑死,先让它读懂产品经理那变来变去的需求再谈替代吧