embedding检索出来的chunk经常对不上问题,反而手动塞进去的上下文回答更准。rag是不是被吹过头了
chunk策略很关键按语义切而不是按字数切
文档量小的话直接塞prompt确实更好
rag的优势在大量文档的时候才体现出来
embedding模型选对了吗试试bge-m3
rag不是银弹小数据量就别用了
我也踩过这个坑后来换了检索策略好多了
试试hybrid search混合检索效果会好一些
不存在七号发现还真存在
内部工具代码版权问题小,产品代码要注意
合规检查流程里加一步AI代码审查