字节跳动Seed团队发布扩散语言模型,每秒推理速度2146 tokens
创始人
2025-08-01 02:00:26
0

IT之家 7 月 31 日消息,字节跳动 Seed 团队今天宣布推出实验性扩散语言模型 Seed Diffusion Preview,目标是以结构化的代码生成为实验领域,系统性地验证离散扩散技术路线作为下一代语言模型基础框架的可行性。

实验结果显示,Seed Diffusion Preview 代码推理速度可达到 2146 tokens / s,速度相比同等规模的自回归模型提升 5.4 倍。在多个业界基准上,Seed Diffusion Preview 性能与优秀的自回归模型相当,并在代码编辑等任务实现超越

IT之家从 Seed 团队介绍获悉,在实现高效采样的同时,模型在多个代码生成基准测试中,表现出与同规模自回归模型相当的性能。此外,在代码编辑(如 CanitEdit 等)这类需要全局视角规划的任务中,模型展现了扩散模型框架的内在优势,性能超过基于自回归的模型,为解决更复杂的结构化推理问题提供了新的可能性。

官方表示,Seed Diffusion Preview 验证了离散扩散模型在大型语言模型上的推理加速潜力。团队同时认为,推理加速仅是这一技术路径最直接的表层优势。Seed Diffusion 项目将致力于挖掘其更深远的价值,持续探索其规模化定律与在复杂推理任务中的应用。

相关内容

热门资讯

石家庄市低空经济产业招商推介会... 5月14日,由石家庄市人民政府主办、市投资促进局承办的低空经济产业招商推介会顺利召开。 此次活动全面...
百度成立“模型委员会”,国内大... 红星资本局5月15日消息,日前百度官宣设置“百度模型委员会”(Baidu Model Committ...
给大国工程做CT!我国首颗能源... 上证报中国证券网讯(记者 王子霖)5月15日,我国首颗能源工程专用SAR卫星“电建一号”顺利进入50...
厘米级精度!宿迁近900公里国... 5月13日,宿迁市公路事业发展中心在324省道开展普通国省道三维测量作业,运用前沿数字化技术为全市普...
山东上线“齐鲁制造会客厅” 勾... 济南5月15日电(记者 孙婷婷)山东打造“齐鲁制造会客厅”系列活动,围绕人工智能、机器人、智能终端、...
IT之家采访联发科:智能体无缝... IT之家 5 月 15 日消息,5 月 13 日,联发科在上海举办了以“全域芯智能,体验新无界”为主...
原创 薪... 当第一缕青烟从枯木摩擦处升起,人类便开启了用化学钥匙解锁能源大门的光辉历程。柴薪作为最古老的能源载体...
济南隆超取得便捷式喷涂装置专利... 国家知识产权局信息显示,济南隆超石油机械锻造有限公司取得一项名为“一种便捷式喷涂装置”的专利,授权公...
原创 中... 光谷国际光电子博览会5月18日一开锣,国家信息光电子创新中心展台前就堵住了——不是为拍展板合影,是真...
镜观东莞・智见未来 | 克里特... AI眼镜产业风口正盛 东莞凭借完整产业链与强大制造能力 稳居全球AI眼镜出货量第一 在东莞凤岗,一家...