上证报中国证券网讯(记者 刘怡鹤)2月18日,OpenAI的一则意见征求再度透露了其尝试开源的新动向。上周,百度也接连宣布了文心一言免费、开源的消息。这背后无疑是DeepSeek强大的开源模型带来的压力。 开源模型意味着更低的使用成本、更灵活地部署和开发。凭借DeepSeek-V3、R1模型爆火以来,不仅各行各业的公司积极接入DeepSeek,近日国民应用微信接入DeepSeek-R1,更让这一开源大模型有了几何级增长的渗透潜力。 “过去大家都比较期待AI原生应用什么时候爆发,但现在看来,原有的移动互联网应用加上AI大模型成为一种新的选择。”一位头部科技公司专家对记者说,这标志着大模型产业的重点从提升基础模型转向了应用和发挥模型红利。 有观点认为,开源与闭源,本就不存在性能差异,而是商业模式选择。对于投入巨大的大模型公司来说,如何获得商业回报仍是一项未解难题。而DeepSeek这一开源模型激发的“鲶鱼效应”,对于AI大模型商业模式的探索来说,机遇与挑战并存。 上述头部科技公司专家认为,首先DeepSeek会给业界带来更多的信心。从2024年下半年开始,AI大模型产业出现了从高涨期转入平淡期的迹象,模型迭代放缓,包括GPT-5迟迟没有面世,商业化也没有特别好的案例。但当前各大科技公司在训练自有大模型的同时,也拥抱更好用的开源模型DeepSeek加强自己的应用,由此带来的用户量增加更有机会实现商业化。与此同时,各行各业的企业也再次积极地去尝试和应用新的大模型。 “DeepSeek的出圈对于供给侧来说是非常好的事,从全社会‘算大账’的角度,激发了更多需求。”这位专家说。2024年,不少大模型公司进行了大量“投流”,如今DeepSeek显然已帮助大模型公司跨过了教育用户这一层面。 复旦大学计算机科学技术学院教授张奇对记者说,在没有大模型之前,开源是计算机领域的一种寻常模式,从软件原厂到生态公司也通过开源获得了相应的收益。之所以大模型会产生闭源的情况和争议,是因为大模型投入的成本过高,相关公司希望保护技术,尽快商业化收回部分投资。目前,开源大模型也并未形成标准化的产品,无法形成类似传统计算机开源软件的商业闭环。 对于此前一些发布开源大模型的厂商来说,通常会有两个版本的大模型:一个是对外公开的开源版本,这个版本可能规模较小,或者在某些能力上有所保留;另一个是厂商自己手中的闭源版本,其性能必然优于开源版本。开源模型的作用主要是吸引客户,展示基础模型的强大能力。用户拿到开源版本后,往往需要厂商的进一步支持和服务,进而被吸引购买更高级的闭源模型。但当DeepSeek带来了更强大的开源模型,这种商业模式无疑面临着新的巨大挑战。 “包括OpenAI、百度等公司的转向,也并非意味着开源商业模式的建立,而是一种‘低头应战’的感觉。”张奇说。 张奇认为,开源与闭源路线并不冲突,关键是模型落地使用的效果如何。归根结底,大模型需要和其他技术结合,找到在其能力边界内的场景,至少达到九十分的解决问题能力,而不是一个六七十分的通用能力。对于大模型公司来说,理想的状态是形成标准化的产品,面向不同客户额外的适配成本要足够低。
上证报中国证券网讯(记者 刘怡鹤)2月18日,OpenAI的一则意见征求再度透露了其尝试开源的新动向。上周,百度也接连宣布了文心一言免费、开源的消息。这背后无疑是DeepSeek强大的开源模型带来的压力。
开源模型意味着更低的使用成本、更灵活地部署和开发。凭借DeepSeek-V3、R1模型爆火以来,不仅各行各业的公司积极接入DeepSeek,近日国民应用微信接入DeepSeek-R1,更让这一开源大模型有了几何级增长的渗透潜力。
“过去大家都比较期待AI原生应用什么时候爆发,但现在看来,原有的移动互联网应用加上AI大模型成为一种新的选择。”一位头部科技公司专家对记者说,这标志着大模型产业的重点从提升基础模型转向了应用和发挥模型红利。
有观点认为,开源与闭源,本就不存在性能差异,而是商业模式选择。对于投入巨大的大模型公司来说,如何获得商业回报仍是一项未解难题。而DeepSeek这一开源模型激发的“鲶鱼效应”,对于AI大模型商业模式的探索来说,机遇与挑战并存。
上述头部科技公司专家认为,首先DeepSeek会给业界带来更多的信心。从2024年下半年开始,AI大模型产业出现了从高涨期转入平淡期的迹象,模型迭代放缓,包括GPT-5迟迟没有面世,商业化也没有特别好的案例。但当前各大科技公司在训练自有大模型的同时,也拥抱更好用的开源模型DeepSeek加强自己的应用,由此带来的用户量增加更有机会实现商业化。与此同时,各行各业的企业也再次积极地去尝试和应用新的大模型。
“DeepSeek的出圈对于供给侧来说是非常好的事,从全社会‘算大账’的角度,激发了更多需求。”这位专家说。2024年,不少大模型公司进行了大量“投流”,如今DeepSeek显然已帮助大模型公司跨过了教育用户这一层面。
复旦大学计算机科学技术学院教授张奇对记者说,在没有大模型之前,开源是计算机领域的一种寻常模式,从软件原厂到生态公司也通过开源获得了相应的收益。之所以大模型会产生闭源的情况和争议,是因为大模型投入的成本过高,相关公司希望保护技术,尽快商业化收回部分投资。目前,开源大模型也并未形成标准化的产品,无法形成类似传统计算机开源软件的商业闭环。
对于此前一些发布开源大模型的厂商来说,通常会有两个版本的大模型:一个是对外公开的开源版本,这个版本可能规模较小,或者在某些能力上有所保留;另一个是厂商自己手中的闭源版本,其性能必然优于开源版本。开源模型的作用主要是吸引客户,展示基础模型的强大能力。用户拿到开源版本后,往往需要厂商的进一步支持和服务,进而被吸引购买更高级的闭源模型。但当DeepSeek带来了更强大的开源模型,这种商业模式无疑面临着新的巨大挑战。
“包括OpenAI、百度等公司的转向,也并非意味着开源商业模式的建立,而是一种‘低头应战’的感觉。”张奇说。
张奇认为,开源与闭源路线并不冲突,关键是模型落地使用的效果如何。归根结底,大模型需要和其他技术结合,找到在其能力边界内的场景,至少达到九十分的解决问题能力,而不是一个六七十分的通用能力。对于大模型公司来说,理想的状态是形成标准化的产品,面向不同客户额外的适配成本要足够低。