随着 WWDC 2026 苹果正式发布新一代 Apple Intelligence,同时还推出历经两年秘密研发的全新 Siri AI,到底 Siri 能不能摆脱过去人工智障的臭名? 还是苹果又在一年一度的发布会上画大饼? 外媒《AppleTrack》日前针对全新Siri AI进行了13道涵盖个人隐私情境、世界知识、跨App复杂操作与萤幕感知的地狱级深度实测。
这次我们不看苹果官方的宣传简报,直接用最残酷的新旧iOS系统Siri语音助理实测对比,告诉你全新Siri AI的真实完整表现,以及它背后引发的硬件强制分级争议!
苹果Siri AI功能实测1:个人情境与搜寻功能
过去Siri最常被诟病的就是听不懂人话或无法串联前后文,但在这次的实测中,全新Siri AI在个人情境理解与世界知识搜寻两个维度上,展现了极为强大的技术反扑。
个人隐私与对话纪录
外媒直接针对 Siri 测试了一道极刁钻的问题:「是否记得几周前,妈妈提到想买的水瓶是哪一个品牌?」
- 旧版 Siri: 完全无法应对这类需要翻阅过去消息的需求。
- 全新Siri AI: 精准指出品牌是「Lark」,甚至根据当初的聊天纪录,贴心提醒当时是因为太贵而作罢,拥有强大的语意理解能力。


相册搜索能力
在要求「找到宠物狗 Winnie 的最新照片并发短信给爸爸」时,新旧版表现如下:
- 旧版 Siri:也同样找不到,还把宠物狗 Winnie 误认成卡通小熊维尼
- 而新Siri AI:展现了完美的系统整合力,不仅能精准从相册认出宠物狗,连同联络人关系、短信发送也一次完成,甚至在行事历完全没记账的情况下,它还能从散落的群组聊天纪录中,推断出「下周碰面」的隐藏进程。

模糊搜寻报价
在模糊搜寻修车报价时,新版Siri也能直接从消息深处捞出Avio Coach Craft的$8,800报价; 甚至在行事历完全没记账的情况下,它还能从杂乱的群组聊天纪录中,智商上线地推断出大家下周碰面的隐藏行程,并列出对话来源。

快速找出行程规划
要是没有在行事历上忘记加入活动行程,在要求Siri来搜寻过去的对话纪录,只有现Siri AI以能够精准,从群聊快速找出兄弟姐妹何时要一起聚会聊天纪录,完全能省去要点开消息搜寻聊天记录。

苹果 Siri AI 功能实测 2:生成式推理
当测试「iPhone Ultra 有哪些可靠传闻」时,全新 Siri AI 也同样能展现出类似 ChatGPT 的回答表现,不再只是丢出冰冷的网页链接,而是整理出极为丰富且精准的传闻资讯,当外媒继续追问关键特色时,Siri AI 更能进一步推理出可能会是「无折痕屏幕」。

要是像 Siri AI 提问日常问题,像是怎么知道鸡肉煮熟了没?
- 旧版 Siri:完全不知道如何回应。
- 新 Siri AI:直接给出 165°F(约 74°C) 的精准科学判断与肉质变色来判断。

苹果Siri AI功能实测3:跨App自动化与视觉辨识
跨 App 自动化操作
实测中,请 Siri AI 从相册找到驾照图片,并将号码填入 PDF 空格,Siri AI 虽然耗时较长,但最终顺利完成。

连同在相册内看一张照片,也能要求Siri AI将这张照片寄给某人,并且在信件内打入标题与内容文字,同样都能自动化协助操作。

目前发生在通过App操作比较不顺,像是要求在《无边际》App 中建立新文件,或在《Pages》中建立新页面时,Siri AI思考后不是吐出「无法执行操作」,就是直接摆烂、变成提供死板的操作步骤教程,这些还需要等后续iOS 27 持续改进优化。

辨识屏幕信息加入联络人
当要求Siri AI读取屏幕上的地址并加入联络人时,操作过程不断卡在思考中与继续等多个确认步骤,最后同样能够完成,但似乎没有之前WWDC发布会展示流畅。

相机 Siri 模式沦为鸡肋
苹果发表会上主打的相机食物营养辨识功能,在实测中也有点尴尬,外媒拿三明治与凯萨沙拉拍照分析,Siri AI 只能含糊地给出「钠含量太高,可能跟火鸡肉或培根有关」的笼统结论,整体分析缺乏大数据支撑的精准度,实用性相当有限。


最强设备端Siri AI模型,引发12GB RAM强制分级争议
苹果在发布会中强调,部分涉及高度机密与复杂运算的Apple Intelligence功能,必须依赖「最强设备端模型」,而这套模型需要有非常严格的硬体门槛,仅支持具备12GB内存(RAM)以上的机型,也就是目前只能支持iPhone 17 Pro系列和iPhone Air机型。
代表Apple Intelligence推出短短两年,苹果就已经开始通过硬体规格进行功能分级,虽然能确保高阶装置的本地运算安全与效能,但对于那些当初为了AI规格而买单、内存却不足12GB的旧款iPhone机型用户来说,不得不为了体验完全体Siri而再度掏钱换机。

iOS 27 Siri AI实测优缺点一分钟懒人包
最后果派哥帮大家把外媒 13 项实测 Siri AI 表现结果浓缩成以下对比表格,这场新旧 Siri 的实战对决,究竟是进化还是翻车? 让你能一秒直接看懂:
| 实测情境维度 | Siri AI | 旧版 Siri |
|---|---|---|
| 个人情境理解 (找照片、翻简讯、记私事) | ⭕ 超精准! 能读懂群组对话脉络、找出好几周前的冷门记忆 | ❌ 找不到、直接罢工 甚至把宠物狗误认成卡通人物 |
| 知识问答与搜索 (传闻推理、生活常识) | ⭕ 表现惊艳! 能进行复杂传闻推理、给出精准科学建议 | ❌ 传统发挥 只会丢出网页搜寻连结给你自己点。 |
| 跨 App 复杂操作 (屏幕感知、AI Agent) | 🔺 可以执行! 但过程卡顿,部分指令直接变成步骤教程 | ❌ 不具备此功能 |
| 相机视觉识别 (食物营养分析) | 🔺 辨识度含糊! 仅能给出钠含量高等笼统回答 | ❌ 无法回答 |
结论:Siri AI有进步但还需要持续改进
总结这次外媒的 13 道地狱实测,全新 Siri AI 的表现可以用前进两步,后退一步来形容,不可否认 Siri 确实变聪明了,能够解决 90% 的日常问答、隐私资料跨时空整合、上下文语意推理上,它的表现无可挑剔,彻底洗刷了过去的恶名。
不过Siri AI在核心的AIAgent跨App自动化操作稳定度严重不足,遇到部分指令甚至会罢工变成教程指南,这部分就需要等待后续iOS 27正式版推出后才能够再进一步确认,毕竟目前还只是在测试版阶段。
