你也许注意到了,这次苹果新Siri在交互上搬进了动态岛,但更值得深挖的是它背后的“脑子”到底换了什么。从现有爆料和苹果过往的技术布局来看,iOS 27里的Siri不再是一个单纯的语音助手,而是一套由端侧小模型、云端大模型、以及中间件调度层构成的混合架构。苹果之所以花了近两年时间跳票,核心就在于要解决隐私、延迟、以及多模型协同这三大难题。
端侧“剪枝”模型做第一道过滤
过去Siri的唤醒和简单指令依赖的是本地规则,反应快但理解能力弱。新架构中,苹果在A18/M5芯片的神经网络引擎上跑了一个经过知识蒸馏的小型Transformer模型,专门处理“今天天气怎么样”“设置五分钟计时器”这类低延迟需求。这个模型参数控制在2B以内,通过Apple Neural Engine的AMX协处理器加速,响应时间压到了150毫秒以下——比你读完这句话还快。更重要的是,所有音频片段和文本解析都在Secure Enclave内完成,物理隔离,云端无从得知。
云侧“大模型路由”才是核心变化
当Siri判定问题需要更复杂的推理(比如“帮我订一张下周三下午飞东京、避开红眼航班的票”),请求就会被加密后发往苹果自建的Private Cloud Compute集群。这里的亮点不是简单调一个LLM,而是一个智能路由层。苹果在集群里同时部署了自家优化的内部模型(可能是基于OpenELM改造的50B级别模型)以及谷歌Gemini的云端API。路由层会根据用户意图的语义嵌入向量,动态选择最优模型:逻辑问题丢给自己,创意生成或图片分析丢给Gemini。用户完全感知不到切换过程,苹果在隐私白皮书里承诺——所有第三方调用都通过PSI(私有集交集)协议隔离,Google拿不到任何用户标识。
个人语义索引:隐私与智能的平衡木
新Siri号称能读屏幕上下文、查日程、避冲突,这背后需要一个本地运行的“个人知识图谱”。苹果的做法是在设备端维护一个不断更新的向量数据库,存储用户的联系人、日历、邮件摘要、短信关键实体(如时间、地点、人名)。这个数据库全部用Core ML的Embedding模型实时编码,更新操作仅在iPhone解锁状态下进行,且不与iCloud同步。当你问“明天下午我有空吗”,Siri不是去云端查,而是直接在本地的Neo4j-like图结构里做子图查询,毫秒级返回。唯一例外是当你明确要求“调一下Airbnb上的房源信息”,Siri才会通过SiriKit向Airbnb服务请求API,返回的数据依然在端侧做一次差分隐私脱敏后才进入对话上下文。
动态岛的“碎片化”交互逻辑
搬进动态岛不只是界面迁移,更是系统级管道重构。以前Siri的语音处理是独占式全屏唤醒,现在变成了可中断、可叠加的轻量级会话。苹果在SpringBoard层新增了一个Dynamic Session Manager模块,专门管理Siri卡片、通知和Live Activity的优先级。当你从顶部下滑呼出搜索界面时,系统实际上是在创建一个短暂的XPC服务进程,与Siri守护进程通过分布式对象通信。这意味着你可以一边在文档里打字,一边让Siri在动态岛里显示一个进度条——比如“正在从相册里找去年夏威夷的照片”,如果你不想等,直接右滑就能取消。这种非抢占式交互,才是新Siri从“助手”进化为“协作者”的关键。
说到底,苹果没有去追逐单一模型的参数竞赛,而是在调度、隐私、本地化这三条线上做了大量工程化取舍。这个架构取舍大概可以总结为:Siri终于不再是一个黑盒子,而是一个透明的、可编排的智能中间件。
