2025年分布式推理网络技术白皮书
创始人
2025-05-05 20:00:22
0

《分布式推理网络(DIN)技术白皮书(2025年)》由中国移动通信有限公司研究院发布,全面剖析了AI大模型时代的业务趋势与挑战。报告指出,以DeepSeek-R1为代表的高性能低成本大模型正驱动AI普惠化,用户从传统内容访问转向AI模型调用,AI Agent通信流量显著增长。然而,端云多模态交互和Agent间东西向流量激增对网络时延提出更高要求,同时暴露出AI推理基础设施能力不足、推理网络架构待完善、服务网络安全防护能力薄弱等核心瓶颈。

报告系统介绍了DIN的分布式架构及其适应多样化推理服务范式的技术体系。DIN通过端、边、网、算协同实现高安全、高并发的网络连接,满足ToB场景下算网一体安全推理、边云协同后训练、模型分层协同需求,同时支持ToC/ToH场景中的大小模型协同推理、训推协同进化、PD分离部署等创新模式。其设计目标包括构建可扩展架构以提供低时延推理服务,通过确定性连接保障数据传输性能,并构建多层次安全防护体系保护数据隐私。

报告总结了DIN关键技术突破,包括微流级流控、细粒度切片等节点间互联质量保障技术,集中式与分布式相结合的推理服务调度方案,以及基于PHYSec技术、拒绝服务防护和轻量化APT监测的模型推理安全体系。展望未来,中国移动将联合产业界完善DIN技术与标准体系,通过融合端边云协同优势应对AI普惠化的时延、安全和成本挑战,推动智能社会建设,助力AI推理服务实现安全、高效、普惠的全面升级。

相关内容

热门资讯

让“济南造”走向全国 济南重工... 鲁网4月2日讯(记者 李秀娟)近日,致敬时代榜样 凝聚奋进力量——“泉城时代榜样”发布活动举行。济南...
歌尔科技申请电子设备散热专利,... 国家知识产权局信息显示,歌尔科技有限公司申请一项名为“电子设备”的专利,公开号CN121772165...
中国科学院院士、地衣真菌学家魏... 魏江春(右)在新疆采集地衣标本。受访者供图 年轻时的魏江春。受访者供图 人物小传 魏江春,1931...
人工智能研究者:从Token到... 科学圆桌会|人工智能研究者:从Token到“词元”,变化背后的分量很重 日前,在中国发展高层论坛2...
798艺术节探讨科技与艺术的共... 当算法遇见画布:解码科技与艺术的共生新纪元 走进798艺术区,你会被一种奇特的“磁场”所吸引。这里...
“商业航天第一股”悬念再起 半导体、机器人、商业航天等硬科技企业正持续涌进资本市场。3月31日晚间,中科宇航技术股份有限公司(以...
【西街观察】Token经济学,... 3月最后一天,顶着“大模型第一股”光环的智谱,交出了上市后的首份年度财报。放在Token经济大热的当...
丰台颁发首张OPC创业扶持企业... 随着人工智能技术快速迭代突破,创业模式持续创新,以“单人+AI”为核心特征的OPC(OnePerso...
曝年底新旗舰将搭载天玑9500... 【CNMO科技消息】4月2日,数码博主“数码闲聊站”爆料称受2nm制程高昂的代工费用影响,有手机厂商...
荣昌生物双抗ADC药物注射用R... 北京商报讯(记者 王寅浩 宋雨盈)4月1日,荣昌生物发布公告称,收到国家药品监督管理局核准签发的《药...