联想控股参与“高质量数据集炼金工坊”生态计划
创始人
2025-05-28 04:20:18
0

数据之于人工智能,犹如石油之于工业时代。高质量数据集的建设是提升AI模型性能的关键,也是推动“人工智能+”行动落地的保障,标志着人工智能发展正在进入“数据驱动”新阶段。

在近日举行的人工智能高质量数据集暨数据标注产业成果发布会上,依托中国人工智能产业发展联盟,联想控股联合中国信息通信研究院人工智能研究所、中国国家图书馆、高等教育出版社、中国科学院文献情报中心、景德镇陶瓷研究院、中国版权保护中心以及百度等单位共同发起“高质量数据集炼金工坊”生态计划。该计划旨在打造一个人工智能与数据要素协同发展的可持续生态体系,将原始数据转化为具有高价值的“数据黄金”,为人工智能的发展提供源源不断的动力,让数据从“沉默的矿藏”变为“流动的黄金”。

数据集,简而言之,是由一系列相关数据整合而成的集合,具备明确的主题,且能够被标识与计算机化处理。作为机器学习和统计建模的基石,数据集为算法学习提供了关键的 “原料”,也是智能应用背后的 “智慧之源”。无论是在助力 AI 模型能力提升方面,还是在推动行业应用落地进程中,根据具体场景选择合适的数据集类型并构建科学合理的数据结构,都已成为人工智能工程中不可或缺的基础性环节。

然而,当前我国在高质量数据集方面却面临着严峻的短缺形势:数据集质量参差不齐,缺乏具有主流高价值的数据引领方向。数据集的混用现象时有发生,这不仅会干扰训练效果,还可能导致大模型出现诸如测试分数虚高、泛化能力减弱、在不相关任务中表现大幅下滑等问题,甚至可能引发实际应用中的不良后果;高质量数据集的标准体系尚处于待完善状态,数据质量评估评价缺乏统一标准,政务领域和重点行业也缺乏典型的主流价值数据集。

鉴于此,各方面正积极投身于高质量数据集的建设工作。国家数据局等17部门联合印发的《“数据要素×”三年行动计划(2024—2026年)》提出,“推动科研机构、龙头企业等开展行业共性数据资源库建设,打造高质量人工智能大模型训练数据集”。中国电子信息产业发展研究院院长张立表示,建设高质量数据集是落实《中共中央国务院关于构建数据基础制度更好发挥数据要素作用的意见》,推动数据产业和数据标注产业高质量发展,推进“人工智能+”行动的重要抓手。

高质量数据集的建设需要政府、行业组织以及龙头企业集团的紧密协作。联想控股将凭借其在制造、医疗、教育、安防、能源、新材料、专业服务、金融和消费等多个领域的应用场景优势,能够提供相应的高质量数据集,其联合中国信息通信研究院人工智能研究所等机构共同发起的 “高质量数据集炼金工坊” 生态计划,正是为了充分释放数据要素的价值,为人工智能的发展筑牢根基。

相关内容

热门资讯

昆船智能获得实用新型专利授权:... 证券之星消息,根据天眼查APP数据显示昆船智能(301311)新获得一项实用新型专利授权,专利名为“...
“歪果仁”看雄安:探索“未来之... 简介:“绿色、智能、创新”是河北雄安新区这座“未来之城”的靓丽名片,北马其顿姑娘伊万娜·伊万诺娃走进...
常发取得拖拉机燃油切换装置专利... 金融界2025年8月18日消息,国家知识产权局信息显示,江苏常发农业装备股份有限公司、常州常发科技开...
前瞻布局、政策开闸,AI喜临门... 当马斯克的Neuralink将芯片植入渐冻症患者大脑时,中国科学家正将脑机接口技术带进日常生活。 在...
苹果Vision Pro头显销... 据外媒报道,资深苹果记者马克・古尔曼在最新一期的《Power On》通讯中指出,苹果的Vision ...
打卡北京通信电信博物馆:穿越1... 21世纪经济报道记者郑青亭、实习生贺一然 北京报道 你知道吗?在北京西城区的骡马市大街9号,藏着一座...
原创 “... 众所周知,对于如今的智能手机行业来说,“跑分”依然是一种具备相当参考价值、衡量设备硬件性能和软件调校...
浪潮电子申请一种液冷散热动态流... 金融界2025年8月18日消息,国家知识产权局信息显示,浪潮电子信息产业股份有限公司申请一项名为“一...
宏晶源化学取得生物化工产品制备... 金融界2025年8月18日消息,国家知识产权局信息显示,河北宏晶源化学有限公司取得一项名为“一种生物...
“用友BIP 5”发布 助力A... 本报讯 (记者向炎涛)8月15日至17日,由用友网络科技股份有限公司(以下简称“用友”)主办的202...