政前方观察|锁定数据标注新赛道,贵州加速入局
创始人
2025-06-26 21:40:25
0

“聚焦做强做优数字经济,以建设高质量数据集为重点发展数据产业。”“数据是重要的生产要素,要加快发展数据标注等数据产业,夯实数字经济发展基础性支撑。”……近期,省委召开专题会对数据产业发展进行部署,“高质量数据集”“数据标注”引人关注。

中国电信云计算贵州信息园一角。(图/潘德玉

“高质量数据集”和“数据标注”是什么?

高质量数据集,就是高价值、高密度、标准化的数据。

有专家曾这样比喻,数据之于大模型,就像石油之于汽车。石油只有炼化成汽油,才能驱动汽车。同样,原始数据需“炼化”成高质量数据集,才能供大模型训练。

因此,数据集的质量影响人工智能的“智商”。

而数据标注产业是对数据进行筛选、清洗、分类、注释、标记和质量检验等加工处理的新兴产业,是“炼化”的关键一环。

由于培育壮大数据标注产业对提升数据供给质量,推动人工智能创新发展具有重要支撑作用,国家已连续多年在政策层面给予指导,推动发展数据标注行业,建设高质量数据集:

2022年,《“十四五”数字经济发展规划》提出,聚焦数据的标注、清洗、脱敏、脱密、聚合分析等环节,提升数据资源处理能力,培育壮大数据服务产业;

2023年,《深入实施“东数西算”工程加快构建全国一体化算力网的实施意见》提出,差异化统筹布局行业特征突出的数据集群,促进行业数据要素有序流通;

2024年,《“数据要素×”三年行动计划(2024—2026年)》提出,推动科研机构、龙头企业等开展行业共性数据资源库建设,打造高质量人工智能大模型训练数据集;

2025年,《关于促进数据标注产业高质量发展的实施意见》提出,到2027年,数据标注产业专业化、智能化及科技创新能力显著提升,产业规模大幅跃升,年均复合增长率超过20%,培育一批具有影响力的科技型数据标注企业。

另外,从市场空间看,数据标注产业前景广阔。

《全国数据资源调查报告(2024年)》显示,2024年,我国开发或应用人工智能的企业数量同比增长36%,高质量数据集数量同比增长27.4%。利用大模型的数据技术企业和数据应用企业同比分别增长57.21%、37.14%,数据正促进人工智能加速发展。

《报告》还预计,2025年,全国数据生产总量有望突破50泽字节。数据治理、数据标注、数据智能等相关企业迎来发展机遇期。

由此可见,入局数据标注行业,正当其时。然而,不论国家政策还是市场空间,都是外部因素。跻身这条新赛道,贵州还需结合实际,发挥自身比较优势。

贵州梦动科技有限公司一角。(图/潘德玉)

发展数据标注产业,贵州的比较优势是什么?

数据标注产业具备两个鲜明特点,一是需要海量数据作原料,二是人力资源需求大。这两者正好是贵州优势明显的领域。

数据中心集聚是贵州的显著优势。截至目前,贵州已集聚48个重点数据中心,既存储了海量数据,数据中心本身也有数据标注需求。

数据中心可谓“油田”,要开采精炼“石油”,企业当然是距离“油田”越近越好。

同时,数据标注企业需要大量人工,如全国数据标注龙头企业东软集团、博彦科技等企业,员工都在数万人规模。

“我觉得贵阳特别适合发展数据标注产业,这座城市的活力非常强。”今年4月来黔考察的上海本原智数科技有限公司创始人李逆勇就认为,贵阳青年人口红利突出,产业基础非常好。

数据显示,贵州全省每年毕业生人数超26万人,其中大数据相关毕业生5.3万人。仅在贵安新区,已累计引育数字人才3.2万人,助力引育数字经济民营企业850家。

推动更多数据标注企业在贵州成长,以人才壮产业,用产业带就业,无疑将打开政府、企业、人才多赢的局面。

此外,贵州数据标注产业发展已有一定基础。

如黔南州惠水县的百鸟河数字小镇入驻167家企业,形成以数据采集标注审核应用服务等业态。

在贵安新区,已集聚中软国际、星长征等数据标注企业7家。2024年,数据标注营收2.8亿元,同比增长44%,从业人数增长107%。

总之,锁定数据标注行业,既有国家大力推动的局势,也有市场前景广阔的形势,如何发挥自身比较优势,形成加快发展的态势,正是我省数据产业壮大的重点课题。

百鸟河数字小镇。(图/潘德玉)

快马加鞭,贵州正在做些什么?

如何破题?政前方梳理发现,今年以来,为推动数据标准产业加快发展,贵州动作频频:

3月7日,省大数据局到上海开展招商考察,重点介绍我省在算力资源、政策支持、市场潜力、人力成本等方面的比较优势;

4月1日,上海市信息化企业家协会24家企业代表来黔考察,部分企业现场签约,与贵州在大数据、人工智能等领域开展合作;

5月6日至8日,贵州大数据集团携手贵阳市云岩区,聚焦数据标注产业发展赴上海开展招商;

5月29日,贵州首批14个公共数据授权运营产品正式亮相,首个数据开发利用加工基地同步揭牌投产。

6月4日,省委召开专题会,听取全省数据产业发展情况汇报,对加快发展数据标注产业进行部署。

专题研究、上门招商、签约合作、发布产品……可以看到,贵州发展数据标注产业已是离弦之箭,志在必得。

未来还要从何处入手?数据、企业、人才、园区、政策五个方面是关键。

要供好数据——推动公共数据集引领开放、行业数据集重点突破,以改革举措加快公共数据资源开发利用;

要壮大“数商”——围绕数据产业“一图三清单”精准招商引资,支持本土企业做大做强;

要引育“数才”——着力引进高层次创新人才,做足产教融合文章;

要聚合“数园”——突出集约集聚,优化空间布局,创新打造特色产业园区,形成优势互补的垂直分工格局;

要优化政策——营造更具竞争力的数据产业生态。

发展新兴产业,贵在先人一招快人一步。培育增长极点,贵在发挥优势久久为功。通过着力完善政策举措、优化产业生态、推动集聚成势,我们有理由相信,瞄定为大模型训练提供高质量数据集的目标,这次“加速”定能不断塑造贵州数字经济发展的新动能新优势。

贵州日报天眼新闻记者 陈玉林

编辑 曾书慧

二审 陈毓钊

三审 马刚

相关内容

热门资讯

南宁在广西率先推出OPC创业夜... 5月18日,南宁市人力资源和社会保障局在全区率先推出OPC创业夜校。这一面向高校毕业生及各类创业群体...
聊诚评丨执文明之笔,绘就水城网... 网络空间是亿万民众共同的精神家园,也是展现一座城市文明程度的重要窗口。近年来,聊城以“网络文明·在聊...
谷歌Gemini Spark个... IT之家 5 月 20 日消息,在今日的 2026 谷歌 I/O 开发者大会上,谷歌发布了 Gemi...
有才包装取得避免下层托盘带起专... 国家知识产权局信息显示,江苏有才包装材料有限公司取得一项名为“一种避免下层托盘带起的吸塑托盘结构”的...
听得懂方言、能预判跌倒,一大批... 随着新技术的不断加持,养老服务的“科技含量”越来越高。在国家会议中心举行的第十二届中国国际养老服务业...
科技生活如何让日常更便捷?这几... 早已不是那种遥不可及概念的科技生活,正极为悄无声息地将自身融入于我们的每日平常之中,从智能家居领域到...
赚麻了!苹果芯片残次品变废为宝... 快科技5月19日消息,在半导体制造环节,受光刻精度、原材料特性等多方面的工艺限制,同一批晶圆上流片生...
透视黑科技!哈糖大菠萝提高胜率... 透视黑科技!哈糖大菠萝提高胜率,谁有老友广东辅助器-本来是真的有辅助插件(哔哩哔哩)1)哈糖大菠萝提...
透视最新!728游戏修改器,对... 透视最新!728游戏修改器,对战互娱辅助-果然真的有辅助教程(哔哩哔哩)1、任何728游戏修改器透视...
第三方辅助!兴动互娱最强辅助神... 第三方辅助!兴动互娱最强辅助神器,开心游戏攻略-原来真的有辅助软件(哔哩哔哩)1、在兴动互娱最强辅助...