首页 > 新闻中心 > 江苏 > 无锡

让数据更好赋能AI发展……2026年江苏省高质量数据集建设推进会在无锡举行

来源: 紫牛新闻

2026-04-23 21:25:00

数聚标注,智启未来,江苏率先构建数据赋能人工智能创新发展新生态。4月23日,2026年江苏省高质量数据集建设推进会暨数据标注产业供需对接会在无锡举行,来自全省数据系统、数据标注及数据集建设单位、人工智能头部企业、重点高校院所、金融机构的近500名代表参会,共同见证数据赋能人工智能创新发展的江苏实践。

启动

“数据集”指的是经过采集、加工等数据处理,可直接用于开发和训练人工智能模型,并能有效提升模型、智能体、智能终端等应用效能的行业数据的集合,包含行业通识和行业专识数据集。行业高质量数据集,是推动"人工智能+"赋能千行百业、实现产业落地的基础性、关键性资源。而数据标注是对原始数据(如图片、文本、语音、视频)进行加工处理,使其能被机器理解和学习。未经标注的数据对AI来说只是无意义的噪音,标注后AI才能从中学习规律。

近日,国家数据局就《关于推进行业高质量数据集建设行动的实施方案(征求意见稿)》,正式向社会公开征求意见。推动形成“场景牵引数据、数据驱动模型、模型赋能应用、应用创造价值”的“数据飞轮”,加快构建数据要素与人工智能协同演进的共生生态。

启动

在江苏这片创新热土上,数据赋能人工智能创新发展的生动实践,正在不断演绎蝶变——132家标注企业构建起超33亿元的产业规模,近1.9万名从业者累计产出1.8万TB精标数据;涵盖工业制造、医疗健康等领域的263个高质量数据集,正在加速流通交易,累计成交额已突破2000万元。

数据赋能,厚积薄发。会议发布了2026年江苏省高质量数据集建设先行先试项目入库名单(452项)、无锡市第二批高质量数据集建设任务(113项),以及数据标注需求清单和能力清单“双榜”,供需匹配一目了然。脉得健康管理超声智检智能体“让娜”、朗新科技能源行业智能体矩阵、联通物研院城市全域感知大模型等一批行业高质量数据集赋能的垂类模型(智能体)典型案例获得推介。无锡市“数据券”首批兑现,7家企业享受政策红利。

供需对接会

数绘蓝图,智领潮头。江苏省数据局、省数交所带领各设区市数据局共同启动“2026年江苏省高质量数据集建设环省行活动”。会议发布了由省、市、区、企业、协会共同发起的《推进高质量数据集建设与数据标注产业发展倡议》。江苏省数据标注产业联盟(筹)正式揭牌,标志着江苏数据标注产业从“单兵作战”迈向“联合作战”新阶段,将汇聚全省骨干力量,推动标准共建、资源共享、行业自律。

签约

在项目签约环节,高质量数据集建设项目、数据标注与语料服务项目、算力与数据流通利用基础设施项目三大类25个项目集中签约总金额达5.26亿元,涵盖医疗影像、车路云协同、商业气象、媒体语料库、教育数据标注、政务智算、医疗数据中心等重点领域,把供需匹配的落脚点锚定在一个个实实在在的具体项目,推动江苏数据标注产业在“生产-流通-应用”产业链布局上,迈出更加坚实的新步伐。

现场,国家数据发展研究院副院长袁军围绕《强化高质量数据集高效供给,提升数据要素赋能人工智能水平》进行主旨演讲,清华大学计算社会科学与国际治理实验室研究员、中国信息协会高质量数据集与数据标注专委会专家委员张影强围绕《人工智能技术发展新趋势与高质量数据集建设思路》作报告,国家工业信息安全发展研究中心人工智能所技术创新部主任樊波专题介绍高质量数据集标准解析与评测技术研究情况。火山引擎、脉得智能、南京中医药大学的专家分享了各自领域的宝贵经验案例,为深化行业交流、加强互进互促作出了积极示范。

项目介绍

大会设置了医疗健康与生命科学、具身智能与智能制造及车联网、政务服务与城市治理三大供需对接专场,每个专场以供需两端企业为主体,形成了需求清单、能力清单和初步撮合清单,推动数据供给与场景需求精准匹配。

高质量数据集普惠评测

专家表示,人工智能发展已从“模型为王”进入“数据为王”的新阶段,行业高质量数据集成为人工智能发展的核心支撑,数据标注产业作为连接数据资源与人工智能应用的桥梁,战略地位日益凸显。当前,江苏正加快构建苏南高端引领、苏中苏北特色跟进的梯度发展格局,推动“知识密集型”与“技术驱动型”数据标注产业双轮并进。

值得一提的是,无锡作为全省数据标注产业高地,已集聚澳鹏科技、央视国际网络、博世软件等龙头企业,服务字节跳动、阿里巴巴、华为、大疆等400多家头部客户,正在向高端化、智能化产业形态发起有力冲锋。

扬子晚报/紫牛新闻记者 张建波

校对 胡妍璐