社科圈用AI编程工具的真实现状

做了个调查,看看搞社科定量的同行们用AI的情况。样本1260人,时间2026年2-3月。结果有点意思。

先说结论:用AI聊天机器人帮忙的挺多,81%的人都试过。但真正把那种能自己写代码、跑分析的编程智能体(比如Claude Code)用到工作里的,只有20%。差距不小。

谁在用?

  • 学科差异大:经济学和政治学的人用得最多(39%和25%),公共卫生、教育这些领域就很少,个位数。
  • 资历越浅用得越多:博士生、博士后里超过四分之一的人每周都用,到了正教授/副教授这块,比例掉了一半多。
  • 性别差距明显:从名字看,典型男性名字的研究者用编程智能体的比例,是典型女性名字的两倍多。
  • 学校好的用得多:顶尖大学的研究者比其他大学的高出40%。

拿来干啥?
主要就两件事:写代码(97%的编程智能体用户和77%的其他AI用户都这么干),还有改文本。真正用来从头起草论文的,反而少,就三分之一左右。大家更指望它当个厉害点的代码帮手和编辑。

用了之后产出有啥不同?
(注意:这只是描述性的比较,不是因果结论。用了工具的人可能本来就更积极、更擅长折腾新东西。)
跟不用编程智能体的人比,用户组在过去半年里:

  • 产出的工作论文(working paper)更多。
  • 提交的基金申请(grant proposal)也更多。
  • 但在期刊投稿、修回这些环节上,两边没看到明显差别。

大家怎么看?
研究人员对AI帮忙写论文发表这事,普遍还挺乐观。但一说到AI对整个社会科学领域的长期影响,很多人就没那么乐观了,担心学术垃圾会变多,审稿压力更大。

总之,编程智能体这玩意,确实开始渗入社科研究了,但用的人还不多,而且分布很不均匀。它现在更像一个“生产力增强器”,在代码和文本处理阶段帮把手,还没到能颠覆整个研究流程的地步。后续的影响,还得再看看。






原文:https://www.anthropic.com/research/coding-agents-social-sciences
来源:Anthropic:Research(发表成果 · 网页)

感觉社科用AI写代码就是个趋势,我们实验室搞经济的几个师兄师姐早就在用了。不过我也发现,用AI改出来的代码,自己还是得花时间debug,有时候它给的方案太“教科书”了,实际数据跑不通,还得自己调。

经济学和政治学果然跑在前面,不奇怪,他们本来就离定量方法近。公共卫生和教育用得少,是不是因为他们的数据分析需求没那么复杂?

图三那个柱状图,能看清横坐标的具体学科标签吗?感觉有点糊,想看看社会学具体排第几。

mark一下,回头细看

这东西就那样,辅助工具罢了。

社科的朋友们,你们现在主要用哪个模型来帮忙写R或者Python的代码呀?是Claude、GPT还是别的?有没有哪个在处理社科面板数据清洗这类任务上特别给力?求推荐!

作为一个教育学的在读博士生,看到这个调查结果深有同感。我们师门几乎没人用编程智能体,大家最多用ChatGPT帮忙润色一下英文。感觉一是我们本身的定量训练可能不如经济学那么系统深入,二是研究问题很多时候质性成分重,代码需求没那么高频和复杂。看了这个数据,我在想是不是也该学学怎么让AI帮忙处理问卷数据了。

大家有没有想过,AI生成的工作论文更多,但期刊发表没差别,这不正好说明产出的可能有很多是“学术快消品”吗?质量把关还是得靠人,工具再好,核心想法和创新还是得研究者自己来。长期来看,审稿人估计要累死了。

跑个题,楼主贴的这几张图,背景配色还挺好看的,是哪个数据可视化工具做的?有谁知道吗?

是不是说,只要会用这种编程工具,哪怕不是计算机背景,也能在社科定量里做得更快啊?我不太确定,感觉没那么简单吧。

八成一的人试过这比例比我想的高,社科也卷起来了

太对了,它给的方案经常太教科书,实际数据一跑就得自己debug半天

社科圈用编程工具的越来越多,门槛降下来是好事

AI给的方案常太教科书,落地还得自己debug

社科用AI写代码是趋势,但生成的还得自己回头核对

辅助是辅助,但确实把搞定量的门槛拉低了

写R和清面板数据我一般用Claude,逻辑稳,GPT偶尔会乱编函数