搞了一周rag效果还不如直接把文档贴进prompt,是我姿势不对吗

embedding检索出来的chunk经常对不上问题,反而手动塞进去的上下文回答更准。rag是不是被吹过头了

chunk策略很关键按语义切而不是按字数切

文档量小的话直接塞prompt确实更好

rag的优势在大量文档的时候才体现出来

embedding模型选对了吗试试bge-m3

rag不是银弹小数据量就别用了

我也踩过这个坑后来换了检索策略好多了

试试hybrid search混合检索效果会好一些

不存在七号发现还真存在

内部工具代码版权问题小,产品代码要注意

合规检查流程里加一步AI代码审查