本报北京7月22日电 (王云杉、张玲)记者从国家数据局获悉:国家数据局指导合肥、成都等7个城市建设数据标注基地,先行先试探索数据标注产业发展经验,截至今年上半年,7个数据标注基地建设数据集524个,服务大模型163个。
高质量数据集是经过采集、加工等数据处理,可以直接用于开发和训练人工智能模型,能够有效提升模型性能的高质量数据集合。
国家数据局副局长余英表示,国家数据局全面加速高质量数据集建设和应用落地,组织开展生态培育专项行动。开展高质量数据集典型案例征集和示范推广,挖掘医疗、工业、交通等重点领域标杆实践;定期举办技术交流活动,围绕数据标注、合成、高质量数据集建设方法论等开展深度研讨;搭建常态化供需对接平台,促进数据供给方、技术提供方、场景应用方精准匹配。
下一步,国家数据局将着力打造“数据标注+高质量数据集+模型+应用场景+市场化价值化”的闭环生态,推进数据要素市场化配置改革和“人工智能+”行动同向发力、同频共振。
来源:人民日报