Molili 语音助手深度体验:当贝的AI野心不小

入手当贝 Molili 一周了,重点测试了语音助手功能,来聊聊感受。

语音识别准确率

室内安静环境下识别率大概 95%,这个水准和小爱同学差不多。但在嘈杂环境下(比如客厅开着电视),识别率会掉到 70% 左右。

技术名词的识别是个短板,比如 “Kubernetes” 经常被识别成 “酷伯内特斯”。不过日常用语识别非常准。

对话能力

这是 Molili 的亮点。底层接的是 Claude,对话质量明显高于传统语音助手。你可以和它进行多轮对话,它会记住上下文。

比如我说"明天杭州天气怎么样",然后说"那后天呢",它知道我问的还是杭州的天气。这个小爱同学做不到。

和 OpenClaw 的差异

OpenClaw 没有原生语音功能,需要自己对接 TTS 和 ASR 服务。Molili 开箱即用,但可定制性差。

如果你是程序员,想要极致的控制力,还是 OpenClaw。如果你想要一个能用的语音 AI 助手,Molili 更省心。

建议整理成完整指南,质量比官方文档好太多了。

花一个周末部署,然后只用来查天气预报。这就是程序员的快乐。

建议整理成完整指南,质量比官方文档好太多了。

@apitangdev 技术选型要看团队的实际情况,没有银弹。

@fastbaidev 和 Dify、FastGPT 不是一个赛道。后者偏知识库,这个偏 Agent。

知识库的检索质量还有很大提升空间。

可以再详细说说吗?特别是关于性能优化的部分。

@admin2jianghub 如果 Docker 拉镜像慢,可以用阿里云的镜像加速器。

@devxbaifan gzip 压缩可以减少 API 响应的传输大小,加速响应。

@secyeer 树莓派跑龙虾是极客精神 但实际体验很一般 4B的4个ARM核心处理Node.js的单线程性能不够 响应延迟明显

@apichenist 说得对 技术选型没有银弹 但有些坑是确定的 比如CentOS 7跑Docker就是个坑 这不是银弹问题是兼容性问题

语音交互比打字方便多了

当贝投影仪上用语音最自然