政前方观察|锁定数据标注新赛道,贵州加速入局
创始人
2025-06-26 21:40:25
0

“聚焦做强做优数字经济,以建设高质量数据集为重点发展数据产业。”“数据是重要的生产要素,要加快发展数据标注等数据产业,夯实数字经济发展基础性支撑。”……近期,省委召开专题会对数据产业发展进行部署,“高质量数据集”“数据标注”引人关注。

中国电信云计算贵州信息园一角。(图/潘德玉

“高质量数据集”和“数据标注”是什么?

高质量数据集,就是高价值、高密度、标准化的数据。

有专家曾这样比喻,数据之于大模型,就像石油之于汽车。石油只有炼化成汽油,才能驱动汽车。同样,原始数据需“炼化”成高质量数据集,才能供大模型训练。

因此,数据集的质量影响人工智能的“智商”。

而数据标注产业是对数据进行筛选、清洗、分类、注释、标记和质量检验等加工处理的新兴产业,是“炼化”的关键一环。

由于培育壮大数据标注产业对提升数据供给质量,推动人工智能创新发展具有重要支撑作用,国家已连续多年在政策层面给予指导,推动发展数据标注行业,建设高质量数据集:

2022年,《“十四五”数字经济发展规划》提出,聚焦数据的标注、清洗、脱敏、脱密、聚合分析等环节,提升数据资源处理能力,培育壮大数据服务产业;

2023年,《深入实施“东数西算”工程加快构建全国一体化算力网的实施意见》提出,差异化统筹布局行业特征突出的数据集群,促进行业数据要素有序流通;

2024年,《“数据要素×”三年行动计划(2024—2026年)》提出,推动科研机构、龙头企业等开展行业共性数据资源库建设,打造高质量人工智能大模型训练数据集;

2025年,《关于促进数据标注产业高质量发展的实施意见》提出,到2027年,数据标注产业专业化、智能化及科技创新能力显著提升,产业规模大幅跃升,年均复合增长率超过20%,培育一批具有影响力的科技型数据标注企业。

另外,从市场空间看,数据标注产业前景广阔。

《全国数据资源调查报告(2024年)》显示,2024年,我国开发或应用人工智能的企业数量同比增长36%,高质量数据集数量同比增长27.4%。利用大模型的数据技术企业和数据应用企业同比分别增长57.21%、37.14%,数据正促进人工智能加速发展。

《报告》还预计,2025年,全国数据生产总量有望突破50泽字节。数据治理、数据标注、数据智能等相关企业迎来发展机遇期。

由此可见,入局数据标注行业,正当其时。然而,不论国家政策还是市场空间,都是外部因素。跻身这条新赛道,贵州还需结合实际,发挥自身比较优势。

贵州梦动科技有限公司一角。(图/潘德玉)

发展数据标注产业,贵州的比较优势是什么?

数据标注产业具备两个鲜明特点,一是需要海量数据作原料,二是人力资源需求大。这两者正好是贵州优势明显的领域。

数据中心集聚是贵州的显著优势。截至目前,贵州已集聚48个重点数据中心,既存储了海量数据,数据中心本身也有数据标注需求。

数据中心可谓“油田”,要开采精炼“石油”,企业当然是距离“油田”越近越好。

同时,数据标注企业需要大量人工,如全国数据标注龙头企业东软集团、博彦科技等企业,员工都在数万人规模。

“我觉得贵阳特别适合发展数据标注产业,这座城市的活力非常强。”今年4月来黔考察的上海本原智数科技有限公司创始人李逆勇就认为,贵阳青年人口红利突出,产业基础非常好。

数据显示,贵州全省每年毕业生人数超26万人,其中大数据相关毕业生5.3万人。仅在贵安新区,已累计引育数字人才3.2万人,助力引育数字经济民营企业850家。

推动更多数据标注企业在贵州成长,以人才壮产业,用产业带就业,无疑将打开政府、企业、人才多赢的局面。

此外,贵州数据标注产业发展已有一定基础。

如黔南州惠水县的百鸟河数字小镇入驻167家企业,形成以数据采集标注审核应用服务等业态。

在贵安新区,已集聚中软国际、星长征等数据标注企业7家。2024年,数据标注营收2.8亿元,同比增长44%,从业人数增长107%。

总之,锁定数据标注行业,既有国家大力推动的局势,也有市场前景广阔的形势,如何发挥自身比较优势,形成加快发展的态势,正是我省数据产业壮大的重点课题。

百鸟河数字小镇。(图/潘德玉)

快马加鞭,贵州正在做些什么?

如何破题?政前方梳理发现,今年以来,为推动数据标准产业加快发展,贵州动作频频:

3月7日,省大数据局到上海开展招商考察,重点介绍我省在算力资源、政策支持、市场潜力、人力成本等方面的比较优势;

4月1日,上海市信息化企业家协会24家企业代表来黔考察,部分企业现场签约,与贵州在大数据、人工智能等领域开展合作;

5月6日至8日,贵州大数据集团携手贵阳市云岩区,聚焦数据标注产业发展赴上海开展招商;

5月29日,贵州首批14个公共数据授权运营产品正式亮相,首个数据开发利用加工基地同步揭牌投产。

6月4日,省委召开专题会,听取全省数据产业发展情况汇报,对加快发展数据标注产业进行部署。

专题研究、上门招商、签约合作、发布产品……可以看到,贵州发展数据标注产业已是离弦之箭,志在必得。

未来还要从何处入手?数据、企业、人才、园区、政策五个方面是关键。

要供好数据——推动公共数据集引领开放、行业数据集重点突破,以改革举措加快公共数据资源开发利用;

要壮大“数商”——围绕数据产业“一图三清单”精准招商引资,支持本土企业做大做强;

要引育“数才”——着力引进高层次创新人才,做足产教融合文章;

要聚合“数园”——突出集约集聚,优化空间布局,创新打造特色产业园区,形成优势互补的垂直分工格局;

要优化政策——营造更具竞争力的数据产业生态。

发展新兴产业,贵在先人一招快人一步。培育增长极点,贵在发挥优势久久为功。通过着力完善政策举措、优化产业生态、推动集聚成势,我们有理由相信,瞄定为大模型训练提供高质量数据集的目标,这次“加速”定能不断塑造贵州数字经济发展的新动能新优势。

贵州日报天眼新闻记者 陈玉林

编辑 曾书慧

二审 陈毓钊

三审 马刚

相关内容

热门资讯

超级未来科技:不是做大模型,而... 在AI、大模型、Web3等技术风口频繁更替的当下,几乎所有科技企业都在讲“场景化应用”“产品即服务”...
打破国外垄断,中广核核电管道堆... 深圳商报·读创客户端记者 张妍 通讯员 朱丹 近日,国家知识产权局公布第二十五届中国专利奖授奖决定。...
南昌市国企不动产监管迈入“可信... 6月24日,南昌市可信数据空间发布会暨数商生态联盟成立大会在南昌市市民中心隆重举行。作为全国18个数...
重生:“人机分工”时代高等教育... 转自:中国传媒大学 作者:廖祥忠 李雨谏 2022年底,ChatGPT横空出世,瞬间打破人类对人工智...
原创 荣... 国产手机这些年有着非常好的表现力,不仅在日常有着很好的实用性,而且品质值得信赖,荣耀300作为数字旗...
AI基础设施新现实:让计算靠近... 随着人工智能在各行各业的企业运营中发挥着变革性作用,数据存储方面的关键挑战不断涌现——无论模型多么先...
多语种AI技术商业化提速,科大... 深圳商报·读创客户端记者 苑伟斌 6月24日,科大讯飞/讯飞医疗技术应用发布会暨香港公司开幕典礼在香...
DXOMARK 发布第六版智能... 2025年6月26日,中国北京,全球领先的智能手机影像、屏幕、电池及其他大众和专业电子产品质量评估领...
38项医疗器械行业标准发布 6月25日,国家药监局发布了YY 0300—2025《 牙科学修复用人工牙》等38项医疗器械行业标准...
讯飞星火医疗大模型V2.5国际... 6月24日,科大讯飞/讯飞医疗技术应用发布会暨香港公司开幕典礼在香港举办,讯飞医疗正式发布星火医疗大...