12月2日,广东省首届高质量数据集创新大赛启动仪式在东莞举行。这场汇聚近500名省、市领导、行业精英与企业代表的盛会,不仅拉开全国首个“真实需求、真实数据、真实方案、真实应用”数据集赛事序幕,更同步见证当日揭牌运营的东莞市数据标注产业园六大赋能平台发布、深圳数据交易所湾区服务创新中心签约落地,为东莞“湾区数谷”建设注入关键动能。作为制造业名城与国家人工智能应用中试基地,东莞正以“赛事+平台+生态”布局,在数据要素市场化改革中探索实体经济赋能新路径。
大赛启幕:全国首创模式,打通数据价值转化闭环
数据作为数字经济核心生产要素,其价值释放依赖高质量数据集支撑。广东此次率先举办高质量数据集创新大赛,属全国“从0到1”的突破性探索。据悉,东莞规上工业企业数量居全国前三,兼具海量工业数据与丰富AI场景,大赛落地为数据赋能制造业提供重要机遇。
大赛以“四真实”为核心原则,创新采用“揭榜挂帅”机制与“分期发榜、全年办赛”模式,聚焦工业制造、医疗健康、城市治理等重点领域,坚持“先找场景、再找数据”,目标打造可复用的高质量数据集,为AI模型训练提供关键“燃料”。启动仪式上,首批赛题正式“发榜”,中国南方电网、广州(国家)实验室、广东省人民医院及东莞本土企业东莞市人工智能与数字经济有限公司、东莞市奥海科技股份有限公司等10家单位,覆盖能源、生物医药、本土制造等领域,率先释放数据需求。
据悉,大赛将通过“1套发榜机制+3个竞赛阶段+N场供需对接会”的“1+3+N”体系,构建“数据供给—技术研发—场景落地—产业升级”闭环。主办方明确,将以赛促用、以赛促产,挖掘低空经济、工业互联网等新兴领域潜力,为全国一体化数据市场建设提供“广东经验”。
平台双擎:政企协同筑牢“湾区数谷”产业根基
数据价值释放需专业平台支撑。启动仪式当天,东莞数标园、深圳数据交易所湾区服务创新中心两大平台同步落地,形成“交易+标注”双引擎,夯实东莞数据产业生态底座。
作为国家数据要素改革先行者,深圳数据交易所自2022年运营以来,已汇聚近5000家市场主体、超3900个上市标的,构建成熟交易规则。此次南城街道与深数所签约共建“湾区服务创新中心”,标志东莞数据产业集聚区(南城)建设提速。
南城街道相关负责人表示,中心将为本地企业提供合规数据交易“牌照”与一站式服务,破解“供给难、流通难、交易难”核心问题。对东莞制造业而言,中心将实现双向赋能:一方面助力企业将存量工业数据合规转化为数据产品,实现价值变现;另一方面结合产业升级需求,从全国引入高质量数据,覆盖研发、生产、销售全链条。
深数所将派驻专业团队驻场,提供数据产品孵化、资产入表咨询等服务,并举办产业活动、匹配数商资源,探索数据资产融资等前沿业务。南城已联合东莞市数据产业发展有限公司、市数据要素产业协会参与运营,拟出台专项政策,营造一流发展环境。
同日,东莞市数据标注产业园(简称“东莞数标园”)正式揭牌运营。该项目由万江街道总投资3.3亿元打造,选址龙湾城市核心区,首期启用超2万平方米办公空间,从启动到运营仅耗时8个月,彰显“东莞速度”。
东莞数标园按“国家所需、湾区所缺、东莞所能”思路,携手中国电信、百度智能云构建“一园两基地六平台”生态——六大平台涵盖数据标注展示、多模态智能标注、人才实训认证等,形成全产业链服务体系。园区计划三年内引进50家以上数据企业,形成30个高质量数据集,集聚2000名产业人才,建成立足湾区、辐射全国的“超级数据基地”。
启动仪式上,首批22家企业集中签约入驻,覆盖北京、上海、广东等10余省市,包括申朴信息、天阳融信2家上市公司,及菲利信科技等头部企业,业务涵盖AI数据标注、自动驾驶数据服务、大模型训练等领域。广东歌捷信息科技总经理莫满春表示,园区租金减免、算力券补贴及人才政策,有效降低企业成本,未来将与东莞本土智能制造企业合作,提供AI数据解决方案。
万江街道负责人指出,数标园是万江响应“人工智能+”战略、培育新质生产力的关键抓手,未来将以园区为核心,在“三江六岸”集聚AI相关生产性服务业,形成“人才集聚—消费升级—产业协同”良性循环。
智慧碰撞:政企研联动探索数据集建设路径
高质量数据集是AI产业发展的核心基石。启动仪式分享环节,三位行业专家围绕数据集建设分享实践经验,为产业发展提供方向。
工业和信息化部电子第五研究所人工智能中心副主任李帅指出,数据预处理、标注、合成及质量评估是构建高质量数据集的核心环节,需系统化协作支撑AI模型应用。目前电子五所正联合数据标注基地、行业龙头,建设高质量数据集测评服务中心,提供标准化生产流程与权威质量认证,从源头保障数据质量。
百度智能云AI数据服务部自动驾驶业务运营负责人沈健聚焦具身智能领域,认为数据是该行业走向通用智能的核心瓶颈,而高质海量训练数据是人形机器人破局关键。百度智能云可根据需求定制采集场景,开展规模化采集作业,并通过“采标管训”全流程平台提升模型能力。
中国电信人工智能科技公司业务发展部副总经理魏文博提出,数据集建设需破解安全合规、工具链支撑等难题。中国电信正构建“一平台三体系”新范式——通过运营一体化平台,支撑数据集建设、质量评估与数据安全三大体系,实现数据可控、高效、合规建设与价值释放。
未来可期:东莞引领大湾区数字经济新征程
此次大赛启幕与两大平台落地,是东莞布局数字经济的系统性举措。东莞坐拥海量工业数据与AI场景,但长期受数据流通不畅、价值变现难等问题制约,此次举措精准破解痛点:深数所中心打通数据交易“大动脉”,数标园提供数据“精加工”平台,大赛搭建供需对接桥梁,形成“数据产生—加工—交易—应用”完整闭环。
从区域视角看,东莞数据产业发展将联动粤港澳大湾区资源——对接广州科研优势、深圳创新活力、佛山产业基础,形成协同发展格局,为国际一流数字湾区建设提供支撑。对全国而言,东莞“赛事+平台+生态”模式,为数据要素赋能实体经济提供可复制的“东莞经验”。
按照规划,东莞将在三年内形成100个行业级高质量数据集,建成全国首个规模化边端智算网络,深化工业数据挖掘。南城街道将以深数所中心为核心,优化产业环境、推动数据场景创新;万江街道将依托数标园构建AI产业生态,培育新经济增长点。
在数据驱动的时代浪潮中,东莞正以务实举措打造数据要素市场化改革标杆,推动“湾区数谷”成为全国数据产业名片,为中国数字经济高质量发展贡献力量。