苹果WWDC下个月就开了,Siri和本地AI升级肯定是重头戏。据说会用一个小号的、蒸馏过的Google Gemini直接在iPhone芯片上本地跑,说是更保护隐私还省token成本。
但整个技术栈其实挺依赖外部的。本地模型就是从Gemini蒸馏出来的。要是遇到手机搞不定的复杂查询,就直接转给Google Cloud了(!)。苹果现在也批准用Nvidia的机密计算技术来处理这些活。
另外听说苹果还在找做小模型压缩的初创公司,想加快进度,比如考察了Liquid AI这种。
跟2024年刚发布那会儿比,有个地方悄悄变了:那时候苹果承诺,所有离开你手机的数据都会在它那个“私有云计算”(用苹果自家芯片)上跑。但现在它在那上面跑不了完整的Gemini,所以这类查询就改道Google Cloud了。不过“私有云计算”这名字倒是会留着。
等下,有点没看明白。“要是遇到手机搞不定的复杂查询,就直接转给Google Cloud了”?这是不是说,我如果用Siri问了一个它觉得复杂的问题,我的请求数据就会离开苹果的私有云,跑到谷歌的服务器上去处理?那这还叫啥隐私升级啊,这不就是传统云处理换了个供应商吗?苹果怎么界定什么是“手机搞不定”的复杂查询呢?这个切换过程用户能有感知或者选择权吗?
aibtz
4
又是隐私保护又是省token,听着不错,但最后复杂问题还是扔给谷歌云了?合着隐私保护是有条件的呗,得看你的问题够不够简单。这操作有点眼熟啊。
之前玩过在Mac上本地跑小模型,确实比联网的慢不少,而且容易崩。如果苹果这个是基于Gemini蒸馏的,效果可能也就那样,处理点日常命令差不多了,真别指望它能有多智能。复杂任务甩给云,那延迟和不确定性又回来了。折腾一圈,感觉就是为了说“我们有本地AI”这个噱头。
本地小模型跑日常云端接复杂活,这思路挺合理,就怕切换卡顿