【“数”话江苏新实践③】看新兴产业掘金“数字宝藏”
来源: 紫牛新闻
2025-11-27 21:56:00
就餐发票、文献资料、车架号……未经发掘的数据看似平平无奇,但经过高质量“开采”就成“数据珍宝”,从“沉睡的数字”变为“赚钱的源泉”。近日,扬子晚报/紫牛新闻记者探访数据要素新兴产业的三家代表企业——数族科技(南京)股份有限公司、见鲸科技(南京)有限公司、南京三百云信息科技有限公司。它们在数字时代“掘金”的应用场景,是否给你带来启发?
一张购物发票藏100多类高质量数据
如今,扫码或在平台勾选“我要开票”,已成为消费者就餐、住宿开发票的日常。但几年前,“开票难、开票繁”还困扰着大家——插税盘、输信息,步骤繁琐还易出错;手撕定额票、手写限额票,更是没法核验。2017年5月,数族科技推出全国首个发票云,发明全国第一张自助开票二维码,拉开发票数字化服务的序幕。
8年多过去,数族科技的“臻票云”已服务超400万家纳税经营主体,每年采集发票约10亿张。“一张购物发票,藏着100多类高价值数据。”数族科技创始人徐剑说。目前,该公司已在江苏省数据交易所上架近300款数据产品,既有34款产业集群企业数据集,也有200多款数据应用类产品。
这些数据产品就像企业的“智能体检单”。比如“企业发票分析报告”和“企业财税经营分析报告”,能清晰呈现企业各项经营指标,并附带指标解读、行业对标、原因分析和对策建议。徐剑直言:“能帮企业实实在在‘省钱、赚钱、找钱’。”
2025年7月,数族科技拿下00001号人工智能高质量数据集评价证书,印证了其数据研发实力。数据领域的新职业也让人耳目一新。2025年3月,数族科技副总经理戴方明获得数据资产运营官证书。基于公司模型,一个月数十万条的海量售后数据,他半小时就能提炼出关键信息;他用发票数据帮银行做贷前审查,原本十天半个月的流程,如今5到10分钟就完成。
结合数据对企业的“动态诊断”成为数族科技的主营业务,2024年的营收首次超过发票业务。2025年,公司总营收预计3亿元左右,其中超2亿元来自数据业务。展望未来,“数字宝藏”的前景还很广阔,或许正如数族科技Logo中的巧思——数字、数族的首字母都是“SZ”,二者拼成了“∞”(无穷大),“代表着无限可能。”徐剑说。
3岁“小鲸鱼”靠数据年收增逾10倍
见鲸科技的文化墙上贴着一条条“小鲸鱼”,每一条上都有手写寄语,见证着公司创立3年来,与员工的共同成长。“见鲸寓意我们正在科研的蓝海中探索,也寄托着对创造美好事物的预期。”见鲸科技创始人任浩是一名“90后”。公司员工约100人,平均年龄28岁。
公司自研鲸灵AI科研垂直大模型,并研发了包括文献、定题、标书、实验、数据、写作等基础科研全路径的科研应用矩阵。其中,见鲸科技的小绿鲸英文文献阅读器,是国产文献管理类软件用户量第一,也是国内首款受邀入驻“华为鸿蒙千帆计划”的科研应用。
公司数据集上拥有超过5万本国际学术期刊,涵盖医学等共113个一级学科,并收录超过1.6亿篇优质英文学术文献和800多万项全球范围内科研基金数据,经过对数据的脱敏、清洗、预处理与关键信息提取,为国内数百万基础科研人员提供AI与数字化解决方案。以课题申报场景为例,可将传统方式下需要3个月的定题决策周期,缩短到5分钟并显著提升决策质量。
“见鲸科技旗下科研应用矩阵的累计注册用户即将突破400万,高峰日活超过30万,并以每年超100万的新增注册速度保持持续增长。”任浩介绍,从2022年的营收数十万元,到2024年的营收过千万元,公司每年都在飞速上台阶。
二手车交易有了数据“身份证”
曾几何时,二手车用户对行业的不信任,是制约市场发展的痛点。“通过深度学习和人工智能技术,车300深度融合公共数据、企业自有数据及第三方数据,构建了车型识别大模型、车辆估值大模型和车况分析大模型,解决了困扰千万消费者的问题。”三百云创始人&CEO(首席执行官)许伟介绍,三百云是国内领先的汽车交易与金融数字化服务商,车300APP是一款以二手车估值定价为基础的汽车交易工具。
“比如,你面前有一辆2019款特斯拉Model 3,打开车300,拍摄照片并上传,就可以知道车辆的品牌、车型、配置,并调取对应的车辆历史数据,自动判定车况等级,基于全国交易数据,可以得到买卖双方都认可的精准定价。”许伟介绍,车300APP以二手车估值定价为基础,提供全网车源,支持快速查询车况、车价。
其中,车型识别大模型可以实现高精度、秒级自动化识别;车辆估值大模型整合历史交易数据库和区域供需,动态修正折旧曲线;车况分析大模型训练了AI视觉识别能力,可以远程高效地检测车辆损伤及关键部件状态,实现非标车况的精准量化。
三百云联合创始人&COO(首席运营官)左强翔介绍,车300APP累计下载量超2.4亿,日活130万。估值数据累计调用量超过140亿次。智能远程评估产品——车300快定价,月均检测车辆45万单,较传统方式效率提升80%。
“针对汽车产业链长期存在的车型定义混乱、数据孤岛林立问题,车300建立了严格的车辆基础信息、动态数据格式及跨系统交互规范,让数据有了统一的‘语言’和‘身份证’。”左强翔介绍,2024年,公司有员工近300人,技术人员占比65.24%。三百云已连续多年营收过亿元。
【专家点评】
推动江苏数据产业高质量发展从三方面着力
数据产业作为数字经济的核心引擎,是引领未来发展的关键力量。今年《政府工作报告》强调加快健全数据基础制度,强化数据治理、数据应用等标准化建设和数据安全工作,大力发展数据产业。江苏作为数字经济大省,已在政务数据开放、工业互联网数据应用、金融与消费数据创新等方面形成较为坚实的基础,并初步构建起涵盖数据采集、存储计算、开发利用、流通交易、安全治理等上下游环节的产业链。进一步推动江苏数据产业高质量发展应从以下三方面着力:
一是强化制度与政策支持。加快完善数据产权界定、确权登记、定价评估、交易流通、收益分配等制度建设,建立数据要素市场规范运行机制。完善数据安全与个人信息保护的法规制度,形成兼顾创新与安全的治理框架。
二是提高数据流通效率。进一步开放公共数据,简化企业获取公共数据的流程,降低数据获取门槛;推动行业数据开放共享,允许企业通过合规渠道获取脱敏数据用于模型训练等;探索多元流通模式,推动场内场外交易并行发展,促进数据在区域/行业内的流通与高效利用。
三是加快应用场景落地。推动工业互联网、智能制造、智慧交通、现代金融、医疗健康等重点行业率先实现数据要素化转型,加快培育一批可复制推广的典型应用场景。通过建设省级场景创新联盟和数据流通示范区,实现需求侧和供给侧的高效对接,推动形成闭环的产业创新生态。注重培育数据要素产业链上下游的中小企业,促进场景创新与商业模式创新的互动发展。
宋颖弘(南京大学经济学院博士后、江苏省社会科学院区域现代化研究院助理研究员)
文字:扬子晚报/紫牛新闻记者 沈春宁 马燕
拍摄:朱君贤
剪辑:曾宏亮 朱君贤
视觉:肖甜 黄凤
校对 朱亚萍