谷歌今日宣布,其DeepMind AI研究部门正式发布Gemma 4,这是最新一代开源大语言模型。该模型采用Apache 2.0许可证发布,相比早期Gemma版本的受限许可证,这次实现了真正的开源。
Gemma与Gemini同样都是大语言模型,但这里我们讨论的是AI处理引擎,而非聊天机器人界面。Gemma和Gemini都基于相同的研究和技术开发。区别在于Gemini是基于订阅的封闭产品,而Gemma是可免费下载并在本地运行的开源模型。
本地运行AI模型而无需付费的能力为各种应用带来了益处。许多用户希望在家中运行AI,无需依赖云端,且完全免费。
本地运行能力对于有数据主权或保密要求的企业尤其重要。例如,医疗服务提供商可能面临监管限制,无法与公有云提供商共享患者数据,但仍希望从AI中受益。通过在本地运行整个系统,无数据发送到云端,但AI能力仍然可用。
从智能手机到各种物联网和边缘设备,许多设备可能只有间歇性网络连接(或完全没有)。能够在无额外成本和无需连接外网的情况下运行AI操作,在灵活性、安全性和成本控制方面提供了显著优势。
因此,虽然你可能在聊天界面中运行Gemini,但可以在树莓派上安装Gemma来监控工厂流程并实时做出决策,避免往返云端的延迟。
早期版本的Gemma采用Gemma使用条款声明许可,而非正式的开源许可结构。谷歌允许用户下载Gemma,在本地使用并进行修改,但限制使用范围为批准类别,并限制重新分发。
这种方式允许该模型系列被称为"开放"但不是"开源"。使用Gemma有很多自由度,但谷歌仍保持控制权。
相比之下,Apache 2.0许可证授予近乎完全的自由。用户和开发者可以将软件用于任何目的,无论是个人、商业还是企业用途,且无需支付版税。如果分发软件,需要包含Apache 2.0许可证副本并提供必要的软件归属声明。
用户和开发者可以自由修改和重新分发代码,有权创建衍生作品并分发原版和修改版本。
Apache 2.0许可证还有一些有趣的专利相关保护和处罚条款。在保护方面,Apache 2.0许可的用户获得涵盖贡献的任何专利许可,因此专利诉讼不能仅因使用软件而针对用户。另一方面,如果你起诉某人声称软件侵犯了你的专利,你将自动失去使用该软件的许可。
谷歌不再为Gemma 4使用自己的使用条款。相反,他们在Apache 2.0许可证下许可Gemma 4,这意味着用户和开发者可以无限制地以任何方式使用和分发该模型。
自2024年2月Gemma发布两年来,这个开源模型获得了相当大的采用。
据谷歌DeepMind研究副总裁Clement Farabet和集团产品经理Olivier Lacombe表示,"自首代产品发布以来,开发者已下载Gemma超过4亿次,构建了一个拥有超过10万个变体的充满活力的Gemma生态系统。"
现在,Gemma 4作为纯开源软件发布,这意味着我们可以预期采用率将超过过去26个月所见的情况。我们不仅可以预期看到Gemma 4被更多项目采用,而且现在确实可以将AI与能够从强大板载模型中受益的产品、服务和设备捆绑在一起。
Gemma 4实际上是一个四模型套件。其中两个模型专为配备强大GPU(如英伟达H100)的高端服务器设计。这些模型称为26B和31B,具有大参数占用空间。26B版本专注于减少延迟,在推理时激活其总参数集的子集。31B模型旨在最大化原始功能和质量,将其所有能力应用于任何要求解决的问题。
另外两个模型专为低端设计。称为E2B和E4B,这些模型面向移动和物联网设备,尽管它们在家用PC上也能很好运行。这些模型分别具有20亿和40亿参数占用空间,限制设备影响,以便在移动和边缘设备上高效运行。
据谷歌的Farabet和Lacombe表示,"与我们的谷歌Pixel团队以及高通科技和联发科等移动硬件领导者密切合作,这些多模态模型在手机、树莓派和Jetson Nano等边缘设备上完全离线运行,延迟接近零。"
公司表示所有模型都支持以下功能:文本生成、多语言支持、代码生成和理解、数学推理、图像理解和文档解析。
在他们的博客文章中,Farabet和Lacombe说:"Gemma 4的表现超越了20倍大小的模型。对开发者来说,这种新的智能参数比水平意味着以显著更少的硬件开销实现前沿级别的能力。"
Q&A
Q1:Gemma 4与Gemini有什么区别?
A:Gemma 4是开源大语言模型,可免费下载并在本地运行,而Gemini是基于订阅的封闭产品。两者都基于相同的研究和技术开发,但Gemma 4给用户更多自由度,无需依赖云端服务。
Q2:Apache 2.0许可证为什么比之前的许可更好?
A:Apache 2.0许可证授予近乎完全的自由,用户可将软件用于任何目的且无需支付版税,可以自由修改和重新分发代码。而之前的Gemma使用条款限制使用范围并限制重新分发,谷歌仍保持控制权。
Q3:Gemma 4包含哪些不同的模型版本?
A:Gemma 4包含四个模型:26B和31B专为高端服务器设计,其中26B专注减少延迟,31B追求最大功能;E2B和E4B专为移动和物联网设备设计,参数分别为20亿和40亿,可在手机、树莓派等边缘设备上高效运行。