2月22日,2025全球开发者先锋大会“语料筑基 智生时代”主题论坛在上海市徐汇区正式拉开帷幕。论坛由全球开发者先锋大会组委会指导,由上海库帕思科技有限公司承办,漕河泾开发区总公司、上海人工智能实验室、商汤科技、阶跃星辰、稀宇科技等公司联合协办。上海市经济和信息化委员会副主任张宏韬,徐汇区委常委、副区长俞林伟出席论坛并致辞。
会议深度聚焦大模型语料前沿主题,汇聚产学研用顶尖智慧,共同探讨语料数据发展的无限机遇与潜力,共建上海大模型语料繁荣生态,为人工智能大模型创新发展和应用注入新动能。
张宏韬表示,上海已全面战略布局人工智能大模型产业,加速推进“模塑申城”行动方案,为大模型提供强大的基础底座赋能和丰富的应用场景支持,成为产业界创新发展的理想沃土。未来,上海将持续夯实高质量综合语料基座,构建数据语料核心枢纽,加快创新语料服务关键性技术,加速推动“5+6”垂类领域语料工程,完善行业语料供给体系,构建共赢繁荣的语料服务生态,更好助力大模型创新发展和应用。
上海市经济和信息化委员会副主任 张宏韬
俞林伟表示,徐汇作为国家级人工智能产业集聚区,在全市率先发展人工智能大模型产业,市区联手推出了全国首个大模型创新生态社区—“模速空间,打造了算力调度、开放数据、金融服务等五大功能平台,为企业提供“保姆式”“专班式”服务。未来,徐汇将持续做好落实要素保障,持续吸引全球顶尖人才,持续优化大模型和语料服务产业生态,把模速空间打造为“全球最大的人工智能孵化器”,打造徐汇建成全国人工智能高地的创新策源尖峰。
徐汇区委常委、副区长 俞林伟
会上,市经济和信息化委副主任张宏韬、上海信投党委书记、副总裁黄卫军、人民网上海分公司总经理金煜纯、上海人工智能协会秘书长钟俊浩共同发布模塑申城语料普惠计划之语料数据智能创意大赛(简称“CICC”)。依托《模速申城语料普惠计划》,CICC大赛面向全社会寻找“好语料、好技术、好场景”,为上海“模塑申城”工程筑牢语料基石,打通高质量语料数据采集、标注、共享、应用全链路。
模塑申城语料普惠计划之语料数据智能创意大赛正式启动
随后,大会隆重发布2025语料风云榜招募令。为汇聚行业顶尖智慧、构建开放合作生态,在2024年世界人工智能大会上,库帕思发起了首届语料风云榜,一批好企业、好产品脱颖而出。2025语料风云榜将延续“好企业、好产品、好规则”的基本框架,在未来4个月完成征集与遴选,并在2025年世界人工智能大会上正式对外发布“2025中国语料生产商风云榜TOP10”、“2025中国语料服务商风云榜TOP10”。
2025语料风云榜征集正式启动
作为大模型发展前沿重点方向,具身智能发展进入快车道,高质量数据成为推动具身智能应用场景探索工作中的重中之重。此次大会上,库帕思联合国地中心、漕河泾园区、穹彻、智元、松应、傅利叶、星海图、中电科21所、大模型生态发展等企业正式启动具身智能语料专项工程暨“生产伴随”式数据采集项目。工程一期着力打造“生产伴随”、物理场遥操作、仿真合成等3种语料数据采集模式,规模可达5000万条,基本形成国际一流、国内领先的具身智能语料数据供给体系和标准规范体系。
具身智能语料专项工程暨“生产伴随”式数据采集正式启动
为进一步促进高质量语料数据建设,库帕思在市经济和信息化委的指导下,以普惠、链接、创新的态度,携手首批103家企业、科研机构和专家学者,联合发起成立语料工作委员会。语料工作委员会将围绕高质量语料建设,通过优化语料平台与各垂类应用领域链接机制,促进语料方、模型方、应用场景方三方合作模式跑通落地,从而构建高质量、具备应用价值的语料生态。
语料工作委员会正式成立
论坛邀请了行业专家、企业家代表、青年科学家等进行主题演讲。主题演讲环节,上海交通大学刘鹏飞教授带来《下一代大模型训练语料数据的思考与探索》、上海库帕思科技有限公司董事长山栋明带来《大模型垂类应用五步法》、上海人工智能创新中心场景与数据联盟合作中心负责人王宇带来《“万卷·丝路”多语言语料库解读及开源合作计划》。论坛还邀请了医利捷(上海)信息科技有限公司董事长周祺解读《医疗语料数据动态治理和价值提炼》、上海脉策数据科技有限公司首席经济学家陈沁分享《从招聘语料看大模型对劳动力市场的冲击》。
上海交通大学副教授 刘鹏飞
上海库帕思科技有限公司董事长 山栋明
上海人工智能实验室场景与数据联盟合作中心负责人 王宇
医利捷(上海)信息科技有限公司董事长 周祺
上海脉策数据科技有限公司首席经济学家 陈沁
圆桌环节,北京亿欧网盟科技有限公司董事、上海公司总经理缪国成主持,携手上海开放远程教育工程技术研究中心常务副主任肖君、安徽飞数信息科技有限公司常务副总经理谭昶、蜜度科技股份有限公司CTO 刘益东、上海新致软件股份有限公司人工智能数据负责人 倪沁宇,共同探讨《人工智能语料创新发展的“道”与“术”》。
2025全球开发者先锋大会“语料筑基 智生时代”主题论坛,作为库帕思承办的年度语料盛会,深度剖析大模型语料产业发展和未来走势,展现库帕思语料“超级工厂”和枢纽平台的前瞻总体视野,引领并推动着以语料数据为核心驱动的、以产业应用为牵引的大模型创新发展进程,内容从高屋建瓴的行业发展方向、权威成果发布、到“产学研用”各界观点,为行业发展提供新思路、新方法、新路径。期待与社会各界一起阔步AI世界,奔赴智能未来!