Claude Code、Cursor、Windsurf这些Code Agent用起来很爽,但都有个共同的短板:没法直接读 PDF和截图。你让它读一份产品文档,它会告诉你"无法读取",开发流程就断在这里了,那么Claude Code怎么直接解析PDF呢?下面就分享详细的方法。
一、Claude Code怎么直接解析PDF:
1、安装解析指令
通过下面的指令在Claude Code上安装MinerU这个skill技能;
npx skills add tanis90/pdf-converter-mineru
2、完成PDF解析
在技能安装完成之后即可在Claude Code上进行PDF解析了。
二、实际使用场景
场景 1:解析 API 文档写代码
很多老的内部接口文档只有 PDF 格式。直接跟 Agent 说:
“帮我读一下这篇 api_spec.pdf,重点看认证授权章节,然后用 Python 写一个支持重试机制的 client。”
Agent 会自动调 MinerU Skill 把 PDF 转成 Markdown(用 flash-extract),然后从里面提取认证参数写代码。
场景 2:带复杂表格和公式的论文
复现论文时最怕表格数据对不齐、公式变乱码:
“解析这篇 attention.pdf,把第四章的对比表格提取出来作为代码测试的 mocked data。”
双栏排版的顶会论文也能还原成 Markdown,AI 可以正常读取。
以上就是Claude Code怎么直接解析PDF的全部内容,希望对大家提供的了帮助,如果想要了解更多AI使用相关内容,欢迎来CoCoLoop社区交流。
