苹果在人工智能领域的布局历经漫长酝酿。继两年前提出Apple Intelligence概念后,苹果在WWDC 2026大会上正式推出重构版“Siri AI”。这款深度集成Apple Intelligence技术的虚拟助手,旨在彻底改变以往备受诟病的设备端体验。
在升级至iOS 27开发者预览版并加入等候名单后,笔者对Siri AI进行了为期48小时的高强度实测,并将其与谷歌Gemini进行全方位对比。测试结果显示,尽管Siri进步显著,但两家科技巨头在AI助手的定义上存在根本性的哲学分歧。
底层逻辑:本地协调器 vs 云端超级大脑
苹果试图将Siri从简单的语音提示转变为深度集成的系统协调器。Siri AI会在本地索引短信、邮件、日历等大量个人信息,简单请求完全在设备端处理;复杂任务则将去标识化数据发送至基于谷歌Gemini技术栈构建的云端大语言模型(LLM)处理。这种混合架构旨在平衡安全性与计算效率。
相比之下,谷歌Gemini更侧重于云端算力与数据的广泛合成能力。两者并非在争夺同一赛道,而是在竞争定义“什么是AI助手”。
个人数据检索:Siri的主场优势
在测试本地上下文能力时,笔者要求助手追踪短信中的餐厅推荐,核实营业时间并起草午餐邀请。Siri AI凭借系统级搜索索引,一次性完美执行了从识别名称、查询实时信息到起草邮件的全流程。
反观Gemini,尽管启用了Messages扩展,却未能检索到关键短信或邮件,导致交互过程长达五分钟且充满挫折感。在另一项基于邮件内容规划日常工作的测试中,Siri AI不仅提取了Asana任务延误信息,还结合时间上下文建议午餐安排及回复手表聚会邀请;而Gemini未能从收件箱中提取任何有效内容。
在本地私密数据的理解与执行上,Siri AI展现出压倒性优势。
屏幕感知与创意写作:各有千秋
在屏幕内容解读测试中,两者均能准确识别票券图片及密集邮件块,并支持后续日历创建或回复操作。Siri AI的视觉呈现更为简洁低调,而Gemini则略显冗长。此项测试二者打成平手。
在创意写作环节,笔者要求以个人语气撰写关于虚拟乐队Gorillaz的文章。得益于多年积累的Google Workspace数据,Gemini生成的文本更具个性与创意角度,略胜一筹。Siri AI虽能捕捉语调,但受限于本地数据积累时间短,行文略显刻板。需要注意的是,若给予Siri同等量的历史数据,差距有望缩小。
对话流畅度:Siri语音表现惊艳
在多轮快速语音对话及话题切换测试中,Siri AI的表现令人印象深刻。依托iPhone 17 Pro上的200亿参数模型,新版Expressive Voices使得Siri的语音自然度大幅提升,不再带有机械感。虽然Gemini也能保持上下文稳定,但Siri在回答的简练程度与语音听感上更符合用户偏好。
图像生成:谷歌仍具显著领先优势
在使用参考照片生成“我在东京”图像的测试中,谷歌Gemini凭借Nano Banana模型,在面部结构、光照及相似度上表现更佳。苹果的Image Playground虽首次引入写实图像生成,但结果不一致,背景选择也缺乏标志性,整体效果仍处于早期阶段。
在视觉创造力方面,谷歌的技术积累依然构成明显壁垒。
生态连续性:围墙花园 vs 无处不在
Siri AI通过iCloud在iPhone、iPad、Mac等设备间无缝同步对话历史,实现了苹果生态内的透明交接。然而,这种体验严格限定在苹果硬件体系内。
Gemini则基于云端账户,可在任何配备浏览器的设备(包括Windows PC、Chromebook)上即时访问完整对话记录。对于非苹果全家桶用户而言,Gemini的通用性具有不可替代的优势。
结语:两种AI哲学的博弈
此次实测揭示了个人计算未来的两条路径:苹果致力于构建安全、深度集成的本地系统协调器,将设备视为私密庇护所;谷歌则打磨普遍可访问的云端超级智能,优先追求算力与数据的广度。
Siri AI终于兑现了两年前的承诺,其在本地上下文理解、隐私保护及语音交互上的表现,使其成为iPhone用户理想的贴身助手。然而,Gemini在图像生成、跨平台通用性及创意素材积累上的领先,使其在更广泛的场景中具备竞争力。随着Siri AI不断积累个人数据,这场关于隐私与便利、本地与云端的博弈将更加激烈。
【星途科讯 图文丨弋寻】