2025年分布式推理网络技术白皮书
创始人
2025-05-05 20:00:22
0

《分布式推理网络(DIN)技术白皮书(2025年)》由中国移动通信有限公司研究院发布,全面剖析了AI大模型时代的业务趋势与挑战。报告指出,以DeepSeek-R1为代表的高性能低成本大模型正驱动AI普惠化,用户从传统内容访问转向AI模型调用,AI Agent通信流量显著增长。然而,端云多模态交互和Agent间东西向流量激增对网络时延提出更高要求,同时暴露出AI推理基础设施能力不足、推理网络架构待完善、服务网络安全防护能力薄弱等核心瓶颈。

报告系统介绍了DIN的分布式架构及其适应多样化推理服务范式的技术体系。DIN通过端、边、网、算协同实现高安全、高并发的网络连接,满足ToB场景下算网一体安全推理、边云协同后训练、模型分层协同需求,同时支持ToC/ToH场景中的大小模型协同推理、训推协同进化、PD分离部署等创新模式。其设计目标包括构建可扩展架构以提供低时延推理服务,通过确定性连接保障数据传输性能,并构建多层次安全防护体系保护数据隐私。

报告总结了DIN关键技术突破,包括微流级流控、细粒度切片等节点间互联质量保障技术,集中式与分布式相结合的推理服务调度方案,以及基于PHYSec技术、拒绝服务防护和轻量化APT监测的模型推理安全体系。展望未来,中国移动将联合产业界完善DIN技术与标准体系,通过融合端边云协同优势应对AI普惠化的时延、安全和成本挑战,推动智能社会建设,助力AI推理服务实现安全、高效、普惠的全面升级。

相关内容

热门资讯

中部智算枢纽:输送“数字水电煤... 本报记者 贾丽 算力,是数字经济时代的“水电煤”,也是人工智能产业的发动机。当下,算力正向智算、科学...
津南这家“小巨人”又有新突破 天津北方网讯:“五一”假期刚过,位于天津市津南区的华海清科股份有限公司(简称“华海清科”)传来新消息...
工信部批复6G技术试验频率!这... 来源:e公司 6G发展正处于从技术探索迈向未来产业的关键阶段。 工信部批复6G技术试验频率 为进一步...
在海外如何观看腾讯视频?实用指... 作为一名在海外工作的华人,我太懂打开腾讯视频时的无奈:要么提示“该内容仅中国大陆可用”,要么视频加载...
OpenAI推出可在说话时进行... OpenAI刚刚发布了三款新的实时语音模型,称这些模型将“为开发者解锁新一类语音应用”。每款新的语音...
太火了!深圳人最近为何扎堆消费... “五一”假期 深圳华强北的荣耀门店内 市民王先生正拿着最新发布的 折叠屏手机Majic V6反复体验...
【深度融合】四部门发文促进人工... 8日,由国家发展改革委、国家能源局、工业和信息化部、国家数据局联合编制的《关于促进人工智能与能源双向...
产业观察:卫星物联网商用“破冰... 来源:星沙时报 来源:人民网 5月6日,北京国电高科科技有限公司(以下简称国电高科)正式获批开展卫星...
胡金秋两双引领5人上双 广厦客... 【搜狐体育战报】北京时间5月10日CBA季后赛,客场作战的浙江浙商证券以86-81击败山西汾酒,将总...
藏语大模型亮相北京科博会 弥合... 新华社北京5月10日电 题:藏语大模型亮相北京科博会 弥合AI时代“数字鸿沟” 新华社记者郭沛然 对...