最近给自己做的 SaaS 还有朋友的公司,写了个 AI 客服 widget ,干脆做成平台,上传文档就能生成一个嵌入网站的聊天机器人。回答只基于上传的文档,每条回复都会附来源引用。主要是不想再一遍遍回答同样的支持问题了。
技术栈是 Nextjs, MongoDB, Qdrant ,标准向量 RAG 管线,远程 LLM, 大约核心流程 Vibe 了一周多,整体准备内测上线快一个月时间
目前在 public beta ,免费计划够用,收费档位也还没完全定下来,边用边调。
有兴趣的可以试试看: https://kodda.dev
昨天才上线,还没走宣发程序,准备这几天找几个朋友试试修修核心 BUG ,idea 不新,老玩家也好几个了,不确定市场如何,欢迎提意见。
这就上线了?文档预处理怎么做的,分块策略和向量维度能透露下吗,最近也在搞这个总感觉召回率不稳定
不是,又来做这个啊?这赛道都卷成麻花了,没点绝活就是烧钱听个响,楼主你融资了吗就敢往上冲
看起来流程挺清晰的。我自己也试过用LangChain搭类似的,但处理PDF表格的时候效果总是不好,经常乱答。楼主有没有碰到过这种问题?是用的什么解析器?
感觉可以试试看。正好我们团队也在找客服的解决方案,每个月人工成本有点高。不过不确定这种基于文档的AI能不能理解我们那个特别复杂的业务逻辑……
这东西就那样,我司年初搞过一个,冷启动问题就够喝一壶。客户问的问题稍微拐个弯,或者文档里描述不一致,回答就崩了。上线后维护成本比你想象的高,不是搭个管线就完事的。而且现在大厂都在往里挤,小平台没生态优势,获客难。楼主你产品差异化在哪?单靠一个widget够吗?我建议先别想收费,找几个真实企业跑通全流程再说。
SaaS客服场景RAG是真刚需,Qdrant加LLM组合稳定性还行
PDF表格用unstructured或者camelot效果会好一些
分块策略影响召回,512token加overlap 100比较稳