来源:中国经济网
中国经济网北京3月8日讯(记者 李月华 马常艳)“当前中国在人工智能领域已取得显著进展,但要实现从‘跟跑’到‘领跑’的转变,须依赖高质量的数据集来支撑算法研发和应用落地。”全国政协委员、德勤中国董事会主席蒋颖在接受中国经济网记者采访时说。
高质量数据集是推动人工智能规模化应用的关键基础,对提升国家科技创新能力、推动经济高质量发展具有重要意义。近几年,我国数据资源规模优势持续扩大,数据资源开发利用活跃度稳步提升。数据显示,2025年,我国建成高质量数据集超10万个,规模超890PB(拍字节)。
蒋颖指出,高质量数据集可直接用于人工智能模型开发训练,能有效提升模型性能。不过她在调研中发现,当前我国数据集建设仍存在标准不一、管理服务薄弱、应用导向不足等问题,导致数据集重复建设、复用率低、价值释放受限。
对此,蒋颖提出三个方面的建议:一是构建覆盖分类、元数据、质量评价等环节的统一标准体系,推动存量数据标准化改造;二是建立专项协调机制,提供标准化流程、工具模板和技术支持,通过设立财政激励来降低企业负担;三是强化应用导向,要求项目立项明确使用场景,通过评审与监督确保建设成果匹配需求,并推动成熟数据集纳入公共平台实现共享复用。
围绕以应用为导向的高质量数据集建设机制,蒋颖进一步表示,在建设过程中,要通过阶段性评审、验收和动态监督,持续校准数据集建设方向,确保建设成果与实际应用需求高度匹配,避免“为建设而建设”。