特斯拉与SpaceX首席执行官埃隆·马斯克在社交平台上发布预测,称其旗下人工智能公司xAI正在研发的Grok 5大型语言模型有10%的概率实现通用人工智能(AGI),且该概率呈持续上升趋势。
这一目标与xAI此前发布的Grok系列模型形成鲜明对比。2023年11月推出的Grok-1以330亿参数实现接近LLaMA 2(70B)的性能,仅用一半训练资源;2024年4月发布的多模态大模型Grok-1.5V已能通过视觉信息生成Python代码,在RealWorldQA基准测试中超越同类模型。而Grok 5被视为xAI技术跃迁的关键节点,其全新架构设计或突破现有模型对海量数据的依赖,通过更高效的自我学习系统降低训练成本。
在回应网友提问时,马斯克以调侃语气称,Grok 5在AI工程领域的表现已超越加拿大深度学习专家安德烈·卡帕斯(曾主导Meta AI实验室研究)。卡帕斯团队曾提出“模型规模即性能”的范式,而xAI通过优化训练堆栈(基于Kubernetes、Rust和JAX的自定义框架),在资源利用率上实现突破。