开源破局AI落地:中小企业的技术平权与巨头的生态暗战
创始人
2025-11-12 07:00:36
0

来源:21世纪经济报道

21世纪经济报道记者孔海丽、实习生吴佳芸 北京报道

开源与闭源的路线之争已经不存在,但市场不知道的是,开源大幅影响了AI落地的速度与模式。

麦肯锡报告显示,越来越多企业在部署AI驱动的解决方案时,开始扩大采用开源技术。超过50%的受访企业在AI技术栈的数据、模型与工具层面使用开源技术,其中科技、媒体与通信行业的开源AI使用率最高,达到70%。

与限制核心技术访问的“闭源”工具不同,开源通过公开源代码与全球协作,让企业能够根据自身需求,快速定制解决方案。

近日,21世纪经济报道记者在一个AI开源技术分析会上采访了从业者,以了解当下开源AI到底如何“接地气”。

从DeepSeek-v3.2到阿里云的Qwen 3,从Meta的Llama到谷歌的Gemma 3,“百模大战”中掀起的开源浪潮,为中小企业降低了技术跃迁门槛。模型不再是稀缺资源,而是企业落地AI的入口。

“大模型虽然百家争鸣、百花齐放,但依然处在‘春秋战国’时代,难以决胜。”德华安顾人寿总经理助理、首席信息官肖萍表示。目前,德华安顾人寿已通过搭载统一AI平台,集中管理GPU资源,在金融理财的客服、理赔等业务部署AI。

肖萍指出:“作为行业末端的企业,我们要迅速的接入大模型,但也要合理应用以规避风险,不能在一个模型厂商上‘绑死’。”

在AI落地过程中,企业面临的挑战之一是如何高效利用异构资源。许多企业同时拥有GPU、CPU等多样化算力,以及公有云、边缘计算和私有数据中心等多种部署环境。

红帽大中华区资深市场总监赵文斌指出,不同部门或业务场景可能使用不同的大模型或定制小模型,使资源管理更加复杂。

“开源生态可以兼容这些环境,支持企业的不同业务。” 赵文斌说。

因此,随着AI走向生产线,开源AI的叙事也在转变:从“造模型”到“跑模型”,从比拼算法到构建生态。

“开源社区最大的优势是,全球开发者已经打下了一个很好的基础,企业只需要在这个社区中找到觉得不错的技术,拿过来并‘企业化’。”红帽全球副总裁兼大中华区总裁曹衡康说。

曹衡康透露,企业需要有弹性、可扩容的AI应用平台,同时要兼顾成本与信息安全。其中,AI操作系统(AI OS)是“核心中枢”,负责推理任务调度,并提供标准化接口,保证多模型、多硬件环境下的高效运行。

红帽大中华区首席技术官张家驹进一步解释说,AI OS应通过标准化接口和模块化设计,不仅能对应不同的硬件,还要对应不同模型。

“AI的OS要具备真正的价值,一定是标准化的,可被南向或北向的生态合作伙伴集成的,才会成为市场上单独细分的一层。”

张家驹表示:“AI OS的核心应该是推理引擎。”推理引擎类似于传统操作系统在CPU上的作用,通过标准化和模块化设计,实现GPU和其他算力的高效利用,同时支持多模型并行运行。

推理引擎虽然从今年年初起开始被广泛讨论,但依然处于早期阶段。红帽联合产业调研显示,在超过350个企业中,仍有超过51%的企业尚未部署任何推理引擎。

其中,vLLM是一个由加州大学伯克利分校团队开发的高性能、开源 LLM 推理和服务引擎,核心目标是提升 LLM 的推理速度(吞吐量)和GPU资源利用率,同时兼容 Hugging Face 等流行模型库,并支持高并发实时服务。

张家驹介绍,红帽在vLLM上的投入,也是其差异化竞争力的重要体现。今年5月,红帽发布了开源项目llm-d,进一步增强vLLM推理能力,为AI推理的规模化落地提供方案。

全球范围内,Meta的Llama系列也配有推理引擎、微调工具、数据集平台与API接口的生态,但推理框架主要针对自家服务,在跨模型与硬件适配能力方面有限。英伟达的TensorRT则通过GPU的硬件升级,如低精度计算、层融合,提升推理速度和吞吐量。

相比之下,vLLM和SG Lang等开源推理引擎,由于支持多种模型和硬件,更适合企业场景。

这种多模型、多算力兼容的特性,使企业能够不依赖特定厂商,选择最合适的技术方案。

曹衡康强调,从AI试点到规模化落地,企业应充分利用开源社区的“集群效应”,结合企业级AI平台,实现任意云环境、任意模型和加速器的AI部署。

相关内容

热门资讯

物理学陷入停滞——进步主义神话... 当今的物理学家需要抛弃那个极具吸引力的神话——他们正在揭示我们宇宙的隐藏现实。 浏览物理学科普书籍...
从“数字化”到“数智化”(观象... 从“数字化”到“数智化”,一字之变,体现出我国牢牢把握人工智能机遇,体系化推进人工智能产业创新和赋能...
10万次Claude真实对话洞... IT之家 11 月 26 日消息,Anthropic 昨日(11 月 25 日)发布研究报告,通过分...
AI技术应用越广泛,越要明确边... 发展科技的初心和落点都是服务于人,服务于国家和社会。让安全和便捷成为AI技术应用的一体两面,成为技术...
【多彩新论】警惕碎片化传播的负... 注意力不集中,看书听讲说话容易走神,刷手机却停不下来……数字时代的碎片化传播,已成为我们获取资讯的主...
原创 1... 神舟二十二飞船成功发射,代号“天宫应急1号”,并且也圆满完成了中国空间站任务对接,整个任务全面成功了...
工信部:启动为期两年的卫星物联... C114讯 11月26日消息(颜翊)昨日,工业和信息化部正式印发《关于组织开展卫星物联网业务商用试验...
华为Mate80全系降价背后 华为需要通过更亲民的定价,来从iPhone手上抢更多的市场份额。 文|游勇 编|石兆 作为华为旗下最...
亚洲第一!我国自主研制,海试成... ◎ 科技日报记者 都芃 25日,记者从中交天津航道局有限公司获悉,当天下午,新一代超大型耙吸挖泥船“...
一加总裁:第五代骁龙8由一加高... 【CNMO科技消息】11月26日,一加中国区总裁李杰在社交平台透露,已受邀出席当天下午举行的高通“第...