字节跳动Seed团队发布扩散语言模型,每秒推理速度2146 tokens
创始人
2025-08-01 02:00:26
0

IT之家 7 月 31 日消息,字节跳动 Seed 团队今天宣布推出实验性扩散语言模型 Seed Diffusion Preview,目标是以结构化的代码生成为实验领域,系统性地验证离散扩散技术路线作为下一代语言模型基础框架的可行性。

实验结果显示,Seed Diffusion Preview 代码推理速度可达到 2146 tokens / s,速度相比同等规模的自回归模型提升 5.4 倍。在多个业界基准上,Seed Diffusion Preview 性能与优秀的自回归模型相当,并在代码编辑等任务实现超越

IT之家从 Seed 团队介绍获悉,在实现高效采样的同时,模型在多个代码生成基准测试中,表现出与同规模自回归模型相当的性能。此外,在代码编辑(如 CanitEdit 等)这类需要全局视角规划的任务中,模型展现了扩散模型框架的内在优势,性能超过基于自回归的模型,为解决更复杂的结构化推理问题提供了新的可能性。

官方表示,Seed Diffusion Preview 验证了离散扩散模型在大型语言模型上的推理加速潜力。团队同时认为,推理加速仅是这一技术路径最直接的表层优势。Seed Diffusion 项目将致力于挖掘其更深远的价值,持续探索其规模化定律与在复杂推理任务中的应用。

相关内容

热门资讯

九安医疗获得外观设计专利授权:... 证券之星消息,根据天眼查APP数据显示九安医疗(002432)新获得一项外观设计专利授权,专利名为“...
马斯克奥特曼中文对喷, AI ... 现在刷社交媒体,你会发现一些画面精良的爆款视频,其实已经是 AI 制作的。但作为一个创作者,除了要像...
【环时深度】数字智能是否会取代... 来源:市场资讯 (来源:环球网资讯) 来源:环球时报 【环球时报记者 陈子帅 环球时报特约记者 李静...
达立诚取得双液螺杆点胶阀专利,... 金融界2025年8月21日消息,国家知识产权局信息显示,深圳市达立诚自动化设备有限公司取得一项名为“...
2025长三角快递物流展9月启... 2025年9月3日至5日,2025长三角国际快递物流供应链与智能装备展览会(ESYE 2025)将在...
美亚光电获得实用新型专利授权:... 证券之星消息,根据天眼查APP数据显示美亚光电(002690)新获得一项实用新型专利授权,专利名为“...
威海海洋职业学院:科技赋能破解... 中国教育报-中国教育新闻网讯(记者 魏海政)近日,威海海洋职业学院食品与药品系科研团队成功研发一套绿...
DeepSeek V3.1 低... 出品 | 大力财经 作者 | 豆沙包 编辑 | 魏力 最近,AI 界的 DeepSeek V3.1 ...
情绪消费风口下,IP 衍生品如... 当前,IP 衍生品已经成为传播文化内容、提供独特体验、聚集线上线下受众的重要载体。 今年夏天,十五运...
西工大航天科普走进雪域高原 近日,西工大航天学院、航天飞行动力学技术国家级重点实验室郑子轩副教授团队,应中央电视台“心连心”艺术...