筑牢人工智能数据底座
创始人
2025-04-25 14:20:39
0

“以5G、人工智能、大模型等为代表的数字技术迅速发展,今年前两个月数字产业业务收入同比增长8.2%。”工业和信息化部总工程师谢少锋介绍,我国已形成了覆盖基础层、框架层、模型层、应用层的完整产业体系,建成钢铁、煤炭等高质量行业数据集,培育出一批竞争力强的通用大模型和行业大模型,国产大模型登顶全球主流开源社区下载量榜单。

人工智能的发展离不开数据资源开发利用。高质量数据作为人工智能应用底座,对通用大模型和行业大模型都具有很强的保障支撑作用。今年的《政府工作报告》提出,加快完善数据基础制度,深化数据资源开发利用,同时也强调支持大模型广泛应用。

作为数据要素市场化价值化的主阵地,企业对于数据资源开发利用具有较强需求。据经济合作与发展组织测算,数据流动对各行业利润增长的平均促进率在10%左右,在数字平台、金融等行业可达32%。“我们鼓励企业在不违反法律法规、不危害国家安全和公共利益前提下,充分开发利用其在生产经营过程中形成或合法获取、持有的数据。”国家数据局副局长陈荣辉说。

近年来,中国电信通过加强企业数据和外部数据汇聚,形成海量多源数据优势,在企业数智化转型应用上取得显著成效。在用户服务方面,利用网络资源数据、网络感知数据和历史投诉数据,主动修复客户感知;在反诈识别方面,通过话务、漫游行为、终端等数据,构建反诈模型,甄别潜在“涉诈”号码并及时处置;在民生服务方面,根据运营商位置数据及政务公共数据,构建应急通知、民生关怀等能力,已为超过300家政企用户提供大数据短信提醒服务。

“数据要素与人工智能技术深度融合是驱动产业数智化转型的关键动能,数据是训练和优化人工智能模型的核心要素。”中国电信集团有限公司副总经理黄智勇介绍,基于50万小时的脱敏音频数据集,中国电信打造了业界首个支持50种方言自由混说的语音大模型。同时,面向教育、交通等领域,联合用户共同建设99个行业数据集,涵盖语义、语音、图像、视频等类型,推出50余款行业大模型。例如,通过知识库和工单数据开发的星辰政务热线大模型,已在上海等地的12345市民服务热线应用,一次性解决率提升30%,派单准确率提升15%。

同样在政务领域深耕多年的科大讯飞,近期再度升级其星火X1大模型。由于融入了更多场景复杂类型数据,模型的泛化性得到进一步提升,在教育、医疗、司法等多个重点行业扩大应用范围。以司法行业为例,大模型根据材料总结案件事实以及判决理由,精准把握用户指令,详细分析争议点,快速定位关键信息,并输出准确内容,为用户提供专业、可靠的智能支持。

讯飞星火X1升级背后,是一系列技术创新与理念突破。首先,提出了基于问题难度的大规模多阶段强化学习方法,在复杂推理、数学、代码、语言理解等场景提升模型效果。其次,统一模型下的快慢思考混合训练方法,能够充分发挥数据相互促进作用,支撑用户更高效便捷地部署使用。

此外,大模型在电子、原材料、消费品等行业也加快落地,在研发设计、中试验证、生产制造、运营管理等环节得到应用。“我们在典型案例征集遴选中发现,北京一家平板显示企业利用大模型一键生成排产计划,产线排产的时间降低了75%。”谢少锋表示,下一步,工信部将加强通用大模型和行业大模型的研发布局,加快建设工业领域高质量数据集,夯实基础底座。(经济日报记者 李芃达)

相关内容

热门资讯

港口行业迎新突破 全国首个顺岸... 日前,港口行业关键核心技术领域迎来新突破,由天津港第二集装箱码头有限公司自主研发的全国首个顺岸式堆场...
2025性价比高的手机推荐 3... 在2025年游戏市场空前繁荣的环境下,2025性价比高的手机成为大众消费者的共同追求。目前,3000...
华虹半导体申请取环工艺方法专利... 国家知识产权局信息显示,华虹半导体(无锡)有限公司、华虹半导体制造(无锡)有限公司申请一项名为“取环...
SpaceX二代星链系统,计划... SpaceX正计划在2027年推出其第二代星链(Starlink)系统。 该公司在一份最新递交给联邦...
原创 荣... 今天不知道是什么好日子,各品牌基本上都有大事发生。且有两个品牌都在开售新机,有一个品牌在预热新机,还...
喜茶发布2025小事记:奇兰苹... 1月23日 喜茶今日发布2025年度回顾报告(即“小事记”),披露了其在产品研发、渠道布局及全球化业...
捷创新材料取得扣压式人字形支架... 国家知识产权局信息显示,深圳市捷创新材料股份有限公司取得一项名为“扣压式人字形支架”的专利,授权公告...
面对荒诞的AI动画 如何为孩子... 近年来,AI技术在影视领域得到广泛运用,极大地丰富了群众的文化生活。然而记者近日发现,一些在青少年中...
马斯克:明年年底将开始向公众销... 特斯拉CEO马斯克在达沃斯表示,到明年年底,将开始向公众销售人形机器人。 1月19日,据环球网科技援...
交出判断权,陷入“外包自主”陷... 来源:滚动播报 (来源:千龙网) 《算法焦虑:数字时代的恐惧》安东尼·埃利奥特 著 徐法寅 译 格致...