首页 > 新闻中心 > 江苏

涉及交通、医疗、教育……江苏到2027年底建设不少于1000个高质量数据集

来源: 紫牛新闻

2025-08-28 20:16:00

近日,省数据局、省委网信办、省发展改革委、省科技厅、省工业和信息化厅、省财政厅、省人力资源社会保障厅、省国资委联合印发《江苏省发展数据标注产业建设高质量数据集实施方案(2025—2027年)》,提出到2027年底,全省建设不少于1000个完整规范、准确实用的高质量数据集。“高质量数据集”是什么,将如何改变我们的生活?扬子晚报紫牛新闻记者从江苏省数据局了解到,江苏省高质量数据集重点领域首批建设清单涉及交通运输、医疗健康、教育教学等17个与普通人生活密切相关的场景领域,抢占人工智能发展制高点,全面赋能经济社会高质量发展,并在此过程中改变每一个普通人的生活。

绘蓝图:数据标注产业规模全国占比超10%

《方案》明确了发展目标,描绘了到2027年底全省数据标注产业发展和高质量数据集建设的“蓝图”。

届时,江苏省数据标注产业精细化、专业化、智能化和体系化水平显著提升,建成全国领先、全球有影响力的数据标注产业集群,产业规模全国占比超10%,年均复合增长率超20%。

同时,着力打造3个数据标注基地,集中培育10个左右创新引领力强、要素集聚力强、行业影响力强的数据标注重点企业,建设1000个完整规范、准确实用的高质量数据集,遴选100个可复制、可推广的典型应用案例,形成更具活力、更加开放、更有温度的产业和创新生态,为人工智能高水平发展夯实数据底座。

据介绍,《方案》紧扣国家对数据标注产业发展和高质量数据集建设工作要求,围绕发展目标、加强数据资源供给、壮大数据标注产业、加快高质量数据集建设、组织实施等五方面协同做好统筹规划,充分发挥江苏省行业数据富集和应用场景多元优势,抢占人工智能发展制高点,全面赋能经济社会高质量发展。

“高质量数据集”如何改变普通人的生活?

“高质量数据集”这个名词,一般人听起来会感觉“高大上”,但可能却不知道它的作用。那么,这些“数据集”涉及哪些领域,又将在哪些应用场景中改变我们的生活呢?

扬子晚报紫牛新闻记者了解到,就以近年来热度持续“升温”的自动驾驶来说,在与《方案》同时发布的《江苏省高质量数据集重点领域首批建设清单》中,就包括了这一行业。具体来说,自动驾驶行业高质量数据集聚焦路端感知、特定场景与任务、4D成像雷达等,将在自动驾驶模型训练、智能交通管理、交通规划支持场景中应用。再如现今已成为人们重要出行工具的网约车,网约汽车司乘服务数据集将聚焦智能调度、出行保障、订单信息、行程录音等,为司乘服务、客服接单、路线规划、算法优化等提供有力支持。

医疗健康是与普通人生活幸福感关系最密切的领域之一。汇集肿瘤、血液病、代谢病、免疫病等数据的生物信息学高质量数据集,将推动新药研发、临床诊疗、基础医学研究等AI大模型训练取得更多成果。而囊括全省医保定点医院、医保定点药房的医保费用结算、药品耗材交易、诊疗就诊登记数据的医保结算与药品追溯数据集,将在医保基金智能监管、医药产业发展、商保医保服务、医药零售服务等场景中发挥重要作用。

扬子晚报紫牛新闻记者注意到,首批建设清单共涉及交通运输、医疗健康、金融服务、文化旅游、教育教学等17个与普通人生活密切相关的场景领域。根据《方案》,将支持大模型企业、数据服务商、科研院所等主体,使用高质量数据集开展自然语言处理、多模态交互、知识图谱、具身智能训练调优等大模型产业化应用,助力人工智能大模型技术创新、场景应用和产业生态繁荣。

扬子晚报/紫牛新闻记者 万承源


校对 陶善工