字节跳动Seed团队发布扩散语言模型,每秒推理速度2146 tokens
创始人
2025-08-01 02:00:26
0

IT之家 7 月 31 日消息,字节跳动 Seed 团队今天宣布推出实验性扩散语言模型 Seed Diffusion Preview,目标是以结构化的代码生成为实验领域,系统性地验证离散扩散技术路线作为下一代语言模型基础框架的可行性。

实验结果显示,Seed Diffusion Preview 代码推理速度可达到 2146 tokens / s,速度相比同等规模的自回归模型提升 5.4 倍。在多个业界基准上,Seed Diffusion Preview 性能与优秀的自回归模型相当,并在代码编辑等任务实现超越

IT之家从 Seed 团队介绍获悉,在实现高效采样的同时,模型在多个代码生成基准测试中,表现出与同规模自回归模型相当的性能。此外,在代码编辑(如 CanitEdit 等)这类需要全局视角规划的任务中,模型展现了扩散模型框架的内在优势,性能超过基于自回归的模型,为解决更复杂的结构化推理问题提供了新的可能性。

官方表示,Seed Diffusion Preview 验证了离散扩散模型在大型语言模型上的推理加速潜力。团队同时认为,推理加速仅是这一技术路径最直接的表层优势。Seed Diffusion 项目将致力于挖掘其更深远的价值,持续探索其规模化定律与在复杂推理任务中的应用。

相关内容

热门资讯

出版社博士后工作站,是怎样的存... 面对知识爆炸、技术迭代、传播格局深刻重塑的变革,博士后工作站作为连接科研与产业的核心枢纽,为出版业注...
我国大模型应用个人用户注册总数... 多知8月1日消息,据中国新闻网报道,记者从国家网信办获悉,当前 AI 正通过网页、移动应用、API ...
原创 在... 众所周知,无论对于手机、还是电脑行业来说,“游戏”如今都已经成为了推动技术进步,促进硬件更新换代的重...
三大运营商董事长深入一线 调研... C114讯 8月1日消息(岳明)近日,受极端强降雨影响,北京及周边地区防汛形势严峻。中国移动、中国电...
不写论文也能毕业?她用“1微米... 不同于传统意义上的学位论文 2025年的毕业季 机械工程学院2022级硕士研究生王茜 提交的 是一份...
核电大单,再下一城!亚信科技助... 近日,亚信科技中标中国华能集团有限公司旗下海南昌江核电二期工程(即3、4号机组)5G生产无线网络(5...
金锋电子取得多功能信号一转三防... 金融界2025年8月1日消息,国家知识产权局信息显示,金锋电子科技(东莞)有限公司取得一项名为“一种...
先导智能获得实用新型专利授权:... 证券之星消息,根据天眼查APP数据显示先导智能(300450)新获得一项实用新型专利授权,专利名为“...
新研究有望为阿尔茨海默病治疗提... 本文转自【新华社】 新华社耶路撒冷8月1日电(记者王卓伦 路一凡)以色列一项新研究显示,磁性材料表面...
数控机床互联网营销怎么做 在制造业数字化转型的浪潮中,互联网营销已成为数控机床企业拓展市场的重要途径。然而许多企业在实际操作中...