2月22日在上海徐汇召开的2025全球开发者先锋大会“语料筑基 智生时代”主题论坛上,与会人士聚焦大模型语料前沿主题,共同探讨语料数据发展的无限机遇与潜力,共建上海大模型语料生态,为人工智能大模型创新发展和应用注入新动能。
上证报中国证券网讯(记者 宋薇萍 谭镕)2月22日在上海徐汇召开的2025全球开发者先锋大会“语料筑基 智生时代”主题论坛上,与会人士聚焦大模型语料前沿主题,共同探讨语料数据发展的无限机遇与潜力,共建上海大模型语料生态,为人工智能大模型创新发展和应用注入新动能。
该论坛由全球开发者先锋大会组委会指导,由上海库帕思科技有限公司承办,漕河泾开发区总公司、上海人工智能实验室、商汤科技、阶跃星辰、稀宇科技等公司联合协办。上海市经信委副主任张宏韬,徐汇区委常委、副区长俞林伟出席论坛并致辞。
张宏韬表示,上海已全面战略布局人工智能大模型产业,加速推进“模塑申城”行动方案,为大模型提供强大的基础底座赋能和丰富的应用场景支持,成为产业界创新发展的理想沃土。未来,上海将持续夯实高质量综合语料基座,构建数据语料核心枢纽,加快创新语料服务关键性技术,加速推动“5+6”垂类领域语料工程,完善行业语料供给体系,构建共赢繁荣的语料服务生态,更好助力大模型创新发展和应用。
俞林伟表示,徐汇作为国家级人工智能产业集聚区,在上海市率先发展人工智能大模型产业,市区联手推出了全国首个大模型创新生态社区—“模速空间”,打造了算力调度、开放数据、金融服务等五大功能平台,为企业提供“保姆式”“专班式”服务。未来,徐汇将持续做好落实要素保障,持续吸引全球顶尖人才,持续优化大模型和语料服务产业生态,把模速空间打造为“全球最大的人工智能孵化器”,打造徐汇建成全国人工智能高地的创新策源尖峰。
作为库帕思承办的年度语料盛会,大会深度剖析大模型语料产业发展和未来走势,展现库帕思语料“超级工厂”和枢纽平台的前瞻总体视野,引领并推动着以语料数据为核心驱动的、以产业应用为牵引的大模型创新发展进程,内容从高屋建瓴的行业发展方向、权威成果发布、到“产学研用”各界观点,为行业发展提供新思路、新方法、新路径。
会上,上海市经信委副主任张宏韬,上海信投党委书记、副总裁黄卫军,人民网上海分公司总经理金煜纯,上海人工智能协会秘书长钟俊浩共同宣布模塑申城语料普惠计划之语料数据智能创意大赛(简称“CICC”)启动。依托《模速申城语料普惠计划》,CICC大赛面向全社会寻找“好语料、好技术、好场景”,为上海“模塑申城”工程筑牢语料基石,打通高质量语料数据采集、标注、共享、应用全链路。
随后,大会隆重发布2025语料风云榜招募令。为汇聚行业顶尖智慧、构建开放合作生态,在2024年世界人工智能大会上,库帕思发起了首届语料风云榜,一批好企业、好产品脱颖而出。2025语料风云榜将延续“好企业、好产品、好规则”的基本框架,在未来4个月完成征集与遴选,并在2025年世界人工智能大会上正式对外发布“2025中国语料生产商风云榜TOP10”“2025中国语料服务商风云榜TOP10”。
作为大模型发展前沿重点方向,具身智能发展进入快车道,高质量数据成为推动具身智能应用场景探索工作中的重中之重。此次大会上,库帕思联合国地中心、漕河泾园区、穹彻、智元、松应、傅利叶、星海图、中电科21所、大模型生态发展等企业正式启动具身智能语料专项工程暨“生产伴随”式数据采集项目。工程一期着力打造“生产伴随”、物理场遥操作、仿真合成等3种语料数据采集模式,规模可达5000万条,基本形成国际一流、国内领先的具身智能语料数据供给体系和标准规范体系。
为进一步促进高质量语料数据建设,库帕思在上海市经信委指导下,以普惠、链接、创新的态度,携手首批103家企业、科研机构和专家学者,联合发起成立语料工作委员会。语料工作委员会将围绕高质量语料建设,通过优化语料平台与各垂类应用领域链接机制,促进语料方、模型方、应用场景方三方合作模式跑通落地,从而构建高质量、具备应用价值的语料生态。