苹果AI升级:小版Gemini本地跑,复杂活扔给谷歌云

苹果WWDC下个月就开了,Siri和本地AI升级肯定是重头戏。据说会用一个小号的、蒸馏过的Google Gemini直接在iPhone芯片上本地跑,说是更保护隐私还省token成本。

但整个技术栈其实挺依赖外部的。本地模型就是从Gemini蒸馏出来的。要是遇到手机搞不定的复杂查询,就直接转给Google Cloud了(!)。苹果现在也批准用Nvidia的机密计算技术来处理这些活。

另外听说苹果还在找做小模型压缩的初创公司,想加快进度,比如考察了Liquid AI这种。

跟2024年刚发布那会儿比,有个地方悄悄变了:那时候苹果承诺,所有离开你手机的数据都会在它那个“私有云计算”(用苹果自家芯片)上跑。但现在它在那上面跑不了完整的Gemini,所以这类查询就改道Google Cloud了。不过“私有云计算”这名字倒是会留着。

总算不用被录音门吓到了,本地处理点赞

等下,有点没看明白。“要是遇到手机搞不定的复杂查询,就直接转给Google Cloud了”?这是不是说,我如果用Siri问了一个它觉得复杂的问题,我的请求数据就会离开苹果的私有云,跑到谷歌的服务器上去处理?那这还叫啥隐私升级啊,这不就是传统云处理换了个供应商吗?苹果怎么界定什么是“手机搞不定”的复杂查询呢?这个切换过程用户能有感知或者选择权吗?

又是隐私保护又是省token,听着不错,但最后复杂问题还是扔给谷歌云了?合着隐私保护是有条件的呗,得看你的问题够不够简单。这操作有点眼熟啊。

之前玩过在Mac上本地跑小模型,确实比联网的慢不少,而且容易崩。如果苹果这个是基于Gemini蒸馏的,效果可能也就那样,处理点日常命令差不多了,真别指望它能有多智能。复杂任务甩给云,那延迟和不确定性又回来了。折腾一圈,感觉就是为了说“我们有本地AI”这个噱头。

本地小模型跑日常云端接复杂活,这思路挺合理,就怕切换卡顿

本地小模型加云端兜底,这配置思路挺务实

本地跑小模型复杂活扔云端,这思路挺务实

苹果终于肯放下身段抱大腿了,本地跑这思路对