文 | 解码Decode
Sora 2发布两周后,百度的蒸汽机AI视频模型,和谷歌Veo 3.1撞了档期。
两家公司选择同期发布并非有多默契,而是Sora 2带来的压迫感促使它们不得不加快脚步。
奥尔特曼将形容Sora 2为“创意领域的ChatGPT 3.5时刻”,不仅在物理逻辑、画面连贯性、真实感和音画同步等方面实现了质的飞跃,还把Sora从一个“文本到视频”的工具进化成一个“创意到生态”的平台。
这无疑是扔在AI视频生成领域的一颗重磅炸弹,它揭示了另一种可能,按照OpenAI的逻辑,通过Cameo(客串)、Remix(二创)和社交化产品设计这三大支柱,足以彻底重构内容创作的商业逻辑。
这是Google、Meta、TikTok不愿意看到的,却是百度、阿里、360们期待的。百度蒸汽机团队在最近的一次采访中就坦承,Sora 2的产品化和社交裂变方面带来了重要启发。
通过Cameo等功能,Sora巧妙地解决了AI+社交的难题,将重点放在熟人关系的低成本Remix共创上,而非单纯追求视频质量。更重要的是,大模型厂商之间的竞争也从过往简单的模型SOAT比拼升级至产品落地、商业变现等价值维度层面。
这意味着,定义应用与产品能力的重要性正变得与构建模型同样重要。而在大洋彼岸,这也是Sora的同类型产品正在寻求的一条出路。
理性看待Sora 2的进步
Sora 2的技术有多厉害,看发布后快手和百度的态度就知道了:前者号称AI团队假期8天无休,后者副总裁出面接受采访,直言“50多天高强度推进工作”,还不忘替公司美言——“国庆中秋期间属于合法加班”。
相较早期Sora文生视频模型,Sora 2的核心升级主要体现在生成质量和交互能力上:
1)物理一致性显著优化,对刚体、流体、遮挡及碰撞等动力学建模更为精确;
2)可控性增强,镜头运动与叙事节奏能更好响应用户脚本指令;
3)新增原生音频功能,可实现对白与环境音同步生成;
4)画面风格覆盖写实、电影、动画等多类型场景,整体表现更稳定。
在先前基础上,Sora 2实现以往视频模型难及的功能(更精准物理效果、清晰真实感、同步音频、强可控性、广风格范围),能精准遵指令创作兼具想象力与真实动态的视频,既拓展叙事和创意表达工具库,也向精准模拟物理世界复杂性的模型迈进。
总之,Sora 2是一个更具攻击性的迭代,修复了此前的短板再一次领先行业。但在视频质量层面,Sora 2也并非绝对领先。
华泰证券不久前通过在相同prompt下做对比测试,发现可灵与即梦的视频生成质量整体仍优于Sora 2,其中可灵2.5 Turbo已登顶Artificial Analysis文生视频榜首。
百度的蒸汽机AI视频模型不仅是全球首个实现中文音视频一体化的视频生成模型,最新的版本还瞄着Sora 2打——用户可支持无限时长视频生成,并能在生成过程中实时交互,随时改写内容或扩写续集。
换句话说,在技术层面Sora 2几乎没有断代领先优势,但在模式上这一次却是一骑绝尘。
Sora App上线第四天拿下美区App Store免费应用榜第一名,超越OpenAI的ChatGPT和谷歌的Gemini。目前,Sora仍处于邀请制测试阶段,仅在美国和加拿大地区的iOS设备上提供。尽管存在这些限制,Sora仍然登顶苹果美服应用排行榜。
据应用情报提供商Appfigures的数据,在仅限美国和加拿大地区并采用邀请制的情况下,Sora的iOS应用程序于9月30日和10月1日上线后的头两天内,总计获得了16.4万次下载。
从首日下载量来看,Sora尽管不及ChatGPT,但已经和xAI推出的Grok持平,不过考虑到Sora并未全面开放,其市场潜力可能更为巨大。
这也是为何在发布最初的几天后,山姆奥特曼的蹦迪视频迅速在短视频平台消失,Sora APP本质上是OpenAI从“单一对话工具”(ChatGPT)向“生态化社交平台”的核心战略转型。
更直白一点就是,Sora APP本就是来抢短视频饭碗的,它大概率是下一代的短视频平台。
媒体和券商也将客串(Cameos)和混剪(Remix)视为两大革命性功能,认为Sora 2不是简单的视频生成创造工具,而是AI时代的TikTok。
客串(Cameos):用户只需在应用内进行一次性的简短音视频录制,以验证身份并捕捉你的形象,Sora 2模型就能以惊人的保真度将用户上传的形象复刻。之后,用户进行形象授权,将用户的虚拟形象置入任何AI场景中,创建带有用户个人形象的“客串视频”。
混剪(Remix):内置的剪辑工具,只允许用户输入提示词,对平台上的任何视频和潮流进行「二创」,生成属于用户自己的版本。
更重要的是,这一布局并非简单的功能延伸,而是针对AI产品增长逻辑的深层优化,标志着OpenAI从“AI工具提供商”向“AI生态构建者”的转变:
通过Sora APP串联起“模型能力→用户场景→商业变现”的完整链路,既避免了因单一工具属性导致的增长乏力,更以“数据飞轮+社交网络”的双重护城河,巩固了在AI生成式内容领域的领先地位。
AI视频社交,想掀短视频的桌
Sora App自10月4日起持续位居iOS免费榜首的原因,有人总结主要源于三点:
1)UGC玩法丰富。通过Cameo好友入境与Remix二创功能,用户可生成沉浸式互动视频,与好友或名人(如Altman)同框,AI亦使得偏离现实的创意剧情成为可能,兼具趣味性与社交属性。
2)邀请制机制推动社交裂变。Sora采用邀请码制,新用户输入邀请码即可体验,每位新用户又可邀请4位好友参与,既保证了种子用户与目标群体的一致性,也通过稀缺感提升了产品的心理价值。
3)ChatGPT在C端拥有深厚用户基础。ChatGPT网页端与移动端9月 MAU 已分别达到7.9亿(Similarweb)与2.7亿(SensorTower),稳居大语言模型首位,流量基石稳固,同时,Sora网页版与ChatGPT会员捆绑销售,可促进用户导流。
而这种策略后续极有可能会被国内本土化AI视频跟进,尤其是那些具备技术但无社交的产品,比如百度、360、阿里等。毕竟国内产品更强调视频内容创作,类似Cameo与Remix的互动玩法尚未落地,C端社区文化仍处于早期阶段。
对于字节、快手来说,在国内推出一个独立于主平台的AI视频App也并非不可能,毕竟也有导流。
Sora App虽然在国内构不成威胁,但在海外市场仍有杀伤力。Sora App之所被称为 “AI版TikTok”,正是因为界面及首页推荐逻辑与之相似——App主页为垂直视频流,用户可上下滑动浏览其他用户发布的内容。
但这还不是最关键的,OpenAI正在急速构建一个围绕视频生成的、由IP驱动的新生态系统。
其核心就两点:“ granular control(精细化控制)” 和 “ revenue share(收入分成)”。这意味着,Sora将不再是简单的工具,而是一个连接IP方与全球亿万创作者的经济平台。
所谓精细化控制,是指OpenAI将为版权方提供更细粒度的控制权,允许他们对角色生成进行更精确的管理,类似于“肖像同意”模型,但将加入更多控制选项。
而收入分成则表示,OpenAI计划尝试将一部分收入分享给那些希望用户生成自己角色的版权方。
由此一来,Sora有望由APP平台主导,形成“IP+创作者”的收入分成商业模型。
对IP方(好莱坞、游戏大厂、日漫出版社)来说,沉睡的IP资产库变成了可24小时开采的“油井”。不仅可以坐收授权费,更能借助全球创作者的脑洞,维持IP热度和生命力,甚至通过数据反馈(哪个角色、哪种风格最火)指导后续创作。
对创作者而言,终于可以合法、合规、低成本地使用蝙蝠侠、皮卡丘,甚至《三体》中的角色来创作视频。创作从“技术活”变成了“创意活”,核心能力从操作软件变为提示词工程和审美。更重要的是,你的爆款视频将能带来真金白银的平台分成。
尾声
Sora 2的社交属性使其从“工具”变成了“平台”,虽然定义应用与产品的能力被提升到了前所未有的高度,但同时也为其同类产品打开了新的思路。
以往,AI视频产品更多投入用在视频生成质量,对于应用则是尽可能指向B端的广告、教育、自媒体等少数行业,至于C端则很少涉猎。
但在Sora App之后,形势可能会有所改观。
一方面,国内各家都极力追赶Sora 2的技术进度;
另一方面,社交属性的开发令百度等缺乏社交资源的公司嗅到了AI视频的第二种可能。
以及山姆·奥特曼在Sora更新信息之中明确提到的“为创作者提供变现机制”。也就是,Sora补齐编辑功能、增加用户激励机制后,它可能在短时间内为用户找到变现路径,一旦雪球滚大,Sora就有机会成为TikTok一样用户生产、用户消费的闭环平台巨头。
而这恰恰是百度们的希望。