全球首款类脑脉冲大模型“瞬悉 1.0”问世,实现全流程国产化
创始人
2025-09-09 00:22:48
0

IT之家 9 月 8 日消息,据中国科学院自动化研究所官方微信公众号消息,近日,中国科学院自动化研究所李国齐、徐波团队在发表原创内生复杂性理论系列论文的工作基础上,与沐曦 MetaX 合作,打造了类脑脉冲大模型“瞬悉 1.0”(SpikingBrain-1.0),在国产千卡 GPU 算力平台上完成全流程训练和推理,实现了大模型在超长序列推理上数量级的效率和速度提升,展示了构建国产自主可控的新型非 Transformer 大模型架构生态的可行性。研究团队开源了 SpikingBrain-1.0-7B 模型并开放 SpikingBrain-1.0-76B 测试网址,同步公开了经工业界大规模验证的类脑脉冲大模型 SpikingBrain-1.0 中英文技术报告。这是全球首款类脑脉冲大模型,实现了全流程国产化,标志着我国在类脑计算与大模型融合创新方面取得重要突破。

IT之家从官方介绍获悉,研发团队借鉴大脑神经元内部复杂工作机制提出“基于内生复杂性”的大模型构架方式,打造类脑脉冲大模型“瞬悉 1.0”( SpikingBrain-1.0),在理论上建立了脉冲神经元内生动力学与线性注意力模型之间的联系,揭示了现有线性注意力机制是树突计算的特殊简化形式,从而清晰地展示了一条不断提升模型复杂度和性能的新型可行路径。研发团队进而构建并开源了基于脉冲神经元、具有线性(SpikingBrain-1.0-7B)及混合线性复杂度(SpikingBrain-1.0-76B,激活参数量 12B)的新型类脑基础模型,开发了面向国产 GPU(沐曦 MetaX 曦云 C550)集群高效训练和推理框架、Triton 算子库、模型并行策略以及集群通信原语。

李国齐表示,这项成果不仅是我国在类脑脉冲大模型架构和国产算力全流程建设上的重大突破,更为法律、医疗、科学模拟等超长序列应用场景提供了更高效的建模工具,也将启迪下一代神经形态计算理论和芯片设计。

相关内容

热门资讯

服务器“论吨收” IT资产回收... 来源:滚动播报 (来源:经济参考报) 机房角落堆积的淘汰服务器、仓库里闲置的办公电脑,这些IT设备正...
蜜雪冰城进军美国市场引关注 来源:热点解码局 嗯,用户让我分析蜜雪冰城进军美国市场的相关搜索结果,并总结当前网络关注焦点。用户提...
奥尔特曼最新预测:未来告别屏幕... OpenAI的AI硬件计划备受关注,就在近日的一场播客中,被问及在筹备的AI硬件时,OpenAI C...
东华科技招标结果:东华公司-除... 证券之星消息,根据天眼查APP-财产线索数据整理,东华工程科技股份有限公司12月19日发布《东华公司...
对话火山引擎谭待:大模型开始真... 《科创板日报》12月21日讯(记者 张洋洋)在模型能力快速迭代的2024年之后,大模型产业正在进入一...
提供免密支付 设置自动扣款应有... 为深入贯彻落实党的二十大和二十届历次全会精神,推动平台经济创新和健康发展,国家发展改革委、市场监管总...
气象人工智能科学模型“风源”在... (来源:河北日报) 转自:河北日报 气象人工智能科学模型“风源”在雄安发布 本报讯(见习记者康晓博)...
万店光环下,挪瓦咖啡“店中店”... 【大河财立方 记者 郝楠楠 文图】日前,挪瓦咖啡(NOWWA)宣布全球门店数量突破10000家,成为...
MiniMax通过上市聆讯:持... 雷递网 雷建平 12月21日 通用人工智能(AGI)公司MiniMax(稀宇科技)今日通过上市聆讯,...
“小字免责” 或成历史,市监局... 来源:界面新闻 界面新闻记者 | 蔡星卓 界面新闻编辑 | 刘海川 “大字吸睛,小字免责”,...