谷歌Gemma 4开源模型正式发布,手机也能运行强大本地AI
创始人
2026-04-03 20:09:51
0

谷歌今日宣布,其DeepMind AI研究部门正式发布Gemma 4,这是最新一代开源大语言模型。该模型采用Apache 2.0许可证发布,相比早期Gemma版本的受限许可证,这次实现了真正的开源。

Gemma与Gemini同样都是大语言模型,但这里我们讨论的是AI处理引擎,而非聊天机器人界面。Gemma和Gemini都基于相同的研究和技术开发。区别在于Gemini是基于订阅的封闭产品,而Gemma是可免费下载并在本地运行的开源模型。

本地运行AI模型而无需付费的能力为各种应用带来了益处。许多用户希望在家中运行AI,无需依赖云端,且完全免费。

本地运行能力对于有数据主权或保密要求的企业尤其重要。例如,医疗服务提供商可能面临监管限制,无法与公有云提供商共享患者数据,但仍希望从AI中受益。通过在本地运行整个系统,无数据发送到云端,但AI能力仍然可用。

从智能手机到各种物联网和边缘设备,许多设备可能只有间歇性网络连接(或完全没有)。能够在无额外成本和无需连接外网的情况下运行AI操作,在灵活性、安全性和成本控制方面提供了显著优势。

因此,虽然你可能在聊天界面中运行Gemini,但可以在树莓派上安装Gemma来监控工厂流程并实时做出决策,避免往返云端的延迟。

早期版本的Gemma采用Gemma使用条款声明许可,而非正式的开源许可结构。谷歌允许用户下载Gemma,在本地使用并进行修改,但限制使用范围为批准类别,并限制重新分发。

这种方式允许该模型系列被称为"开放"但不是"开源"。使用Gemma有很多自由度,但谷歌仍保持控制权。

相比之下,Apache 2.0许可证授予近乎完全的自由。用户和开发者可以将软件用于任何目的,无论是个人、商业还是企业用途,且无需支付版税。如果分发软件,需要包含Apache 2.0许可证副本并提供必要的软件归属声明。

用户和开发者可以自由修改和重新分发代码,有权创建衍生作品并分发原版和修改版本。

Apache 2.0许可证还有一些有趣的专利相关保护和处罚条款。在保护方面,Apache 2.0许可的用户获得涵盖贡献的任何专利许可,因此专利诉讼不能仅因使用软件而针对用户。另一方面,如果你起诉某人声称软件侵犯了你的专利,你将自动失去使用该软件的许可。

谷歌不再为Gemma 4使用自己的使用条款。相反,他们在Apache 2.0许可证下许可Gemma 4,这意味着用户和开发者可以无限制地以任何方式使用和分发该模型。

自2024年2月Gemma发布两年来,这个开源模型获得了相当大的采用。

据谷歌DeepMind研究副总裁Clement Farabet和集团产品经理Olivier Lacombe表示,"自首代产品发布以来,开发者已下载Gemma超过4亿次,构建了一个拥有超过10万个变体的充满活力的Gemma生态系统。"

现在,Gemma 4作为纯开源软件发布,这意味着我们可以预期采用率将超过过去26个月所见的情况。我们不仅可以预期看到Gemma 4被更多项目采用,而且现在确实可以将AI与能够从强大板载模型中受益的产品、服务和设备捆绑在一起。

Gemma 4实际上是一个四模型套件。其中两个模型专为配备强大GPU(如英伟达H100)的高端服务器设计。这些模型称为26B和31B,具有大参数占用空间。26B版本专注于减少延迟,在推理时激活其总参数集的子集。31B模型旨在最大化原始功能和质量,将其所有能力应用于任何要求解决的问题。

另外两个模型专为低端设计。称为E2B和E4B,这些模型面向移动和物联网设备,尽管它们在家用PC上也能很好运行。这些模型分别具有20亿和40亿参数占用空间,限制设备影响,以便在移动和边缘设备上高效运行。

据谷歌的Farabet和Lacombe表示,"与我们的谷歌Pixel团队以及高通科技和联发科等移动硬件领导者密切合作,这些多模态模型在手机、树莓派和Jetson Nano等边缘设备上完全离线运行,延迟接近零。"

公司表示所有模型都支持以下功能:文本生成、多语言支持、代码生成和理解、数学推理、图像理解和文档解析。

在他们的博客文章中,Farabet和Lacombe说:"Gemma 4的表现超越了20倍大小的模型。对开发者来说,这种新的智能参数比水平意味着以显著更少的硬件开销实现前沿级别的能力。"

Q&A

Q1:Gemma 4与Gemini有什么区别?

A:Gemma 4是开源大语言模型,可免费下载并在本地运行,而Gemini是基于订阅的封闭产品。两者都基于相同的研究和技术开发,但Gemma 4给用户更多自由度,无需依赖云端服务。

Q2:Apache 2.0许可证为什么比之前的许可更好?

A:Apache 2.0许可证授予近乎完全的自由,用户可将软件用于任何目的且无需支付版税,可以自由修改和重新分发代码。而之前的Gemma使用条款限制使用范围并限制重新分发,谷歌仍保持控制权。

Q3:Gemma 4包含哪些不同的模型版本?

A:Gemma 4包含四个模型:26B和31B专为高端服务器设计,其中26B专注减少延迟,31B追求最大功能;E2B和E4B专为移动和物联网设备设计,参数分别为20亿和40亿,可在手机、树莓派等边缘设备上高效运行。

相关内容

热门资讯

NTP时间同步服务器,如何为你... 我们在谈论网络的时候,常常关注的是带宽有多宽、延迟有多低、数据会不会丢。但有一个同样关键、却容易被忽...
小米、京东等互联网大厂同时出手... 当人形机器人开始行走、奔跑,甚至完成空翻时,一个更本质的拷问浮出水面:它们能否像人类一样,真正“拿起...
AI已“无米下锅”:以掼蛋思维... 陆天然/文 从ChatGPT掀起大模型热潮,到AI在多领域落地应用,人工智能的发展恰似一场讲究策略与...
苹果传奇设计师艾维操刀,法拉利... IT之家 4 月 3 日消息,据外媒 Carscoops 于 4 月 3 日(今天)凌晨报道,法拉利...
中控技术申请问答模型验证方法专... 国家知识产权局信息显示,中控技术股份有限公司申请一项名为“一种问答模型验证方法、系统、电子设备和存储...
“人工智能+药品监管”怎么干?... 4月2日,国家药监局发布《关于“人工智能+药品监管”的实施意见》(以下简称《意见》)。 《意见》包括...
原创 “... 2026年4月1日傍晚,美国佛罗里达州肯尼迪航天中心的39B发射台上,322英尺高的太空发射系统火箭...
苏磁智能取得液冷式机壳专利,提... 国家知识产权局信息显示,苏州苏磁智能科技有限公司取得一项名为“液冷式机壳、磁悬浮电机及磁悬浮设备”的...
原创 H... 文字 | 朝乾 校对 | 朝乾 编辑 | 澄澈 最近半个月,石油涨价约15%,很多么?再看氦气,价格...