-
高质量数据集和AI共振 成为数据流通“硬通货”
发布时间:2025-09-04 08:00:22,阅读次数:69 中新网北京9月2日电(记者 吴涛)当人工智能的浪潮席卷全球,其背后的“燃料”——数据,正成为竞相争夺的战略资源。然而,并非所有数据都能加速AI的发展。一场从“海量数据”向“高质量数据集”的变革正在发生。
何为高质量数据集?
2024年12月,国家发展改革委、国家数据局等部门印发《关于促进数据产业高质量发展的指导意见》,首次明确提出“高质量数据集”概念,支持企业面向人工智能应用创新,开发高质量数据集,大力发展“数据即服务”“知识即服务”“模型即服务”等新业态。
近日发布的《高质量数据集建设指引》指出,大模型参数规模指数级增长与多模态能力的拓展,数据需求从“量级积累”转向“量质并重”。
官方数据显示,截至2025年6月,全国建设高质量数据集超3.5万个、总量超400PB;数据交易机构挂牌高质量数据集3364个,作为交易流通中的关键商品,累计交易额近40亿元,规模达246PB。
在近日举行的一场论坛上,中国信息通信研究院院长余晓晖表示,放眼全球,有大量的私域数据,在场景、行业、政府中,这部分数据能够释放出来,是构成高质量数据集非常重要的一个方向。
高质量数据集和AI发展相辅相成
因为AI大模型的训练会用到海量数据,所以,市场一直有观点认为,未来将无数据可用,或者不得不用大量的合成数据。在这种情况下,高质量数据集无疑成为数据流通的“硬通货”。
清华大学数字政府与治理研究院院长、教授张小劲表示,人工智能大模型走到哪里,高质量数据集就走到哪里,反之,高质量数据集走到哪里,人工智能就走到哪里,这是相辅相成的,是双轮驱动的格局。
中国工程院院士吴世忠指出,数据集建设的质量和安全,是大模型发展的生命线,要完善分级分类的数据安全制度,强化全流程的技术防护手段,筑牢防篡改的底层技术能力。在数据集建设中,还要主动融入中华优秀传统文化,避免模型成为利己主义的工具。
目前高质量数据集建设如火如荼,深圳市政务服务和数据管理局党组书记、局长周剑明在国家数据局官网发文分享,深圳市结合公共数据资源授权运营和可信数据空间建设探索,支持高质量公共数据和企业数据等融合应用,已在征信金融、气象、商保理赔等领域开展试点,取得较好成效。(完)
-
相关、相似的资讯
- 由书架走向货架 以“变量”释放“增量”2025/09/04
- 多地发放新一轮消费券激发金秋消费活力2025/09/04
- 中国新型储能规模跃居世界第一2025/09/04
- 重点领域增长强劲 新质生产力正当时2025/09/04
- 6G无线通信领域取得新突破 2025/09/04
- 热门关注
-
- 奋楫十年 天翼云以科技创新刷新“中国速度”每个时代都有各自标志性的生产力,这是时代的烙印,也是衡量经济社会发展水平和质...
- 连续三年亏损 苏宁易购遭“ST”5月5日,苏宁易购停牌,5月6日开市起,这个昔日的零售巨头股票简称将变为“ST易购...
- 苏宁易购筹划股权转让 神秘接盘方近日将亮相2016年成功引入淘宝中国作为重要股东后,时隔4年多时间,苏宁易购再次发布重磅消息...
- 未来金融就在眼前,火星数字资产银行荣获“2018年度区块链创新服务奖”7月5日,“2018区块链世界论坛·深圳峰会”在深圳京基100举行,作为全方位为数字资...
- 公交车司机9年未过团圆年,苏宁彩电助其实现心愿转眼春节就要到了,游子已经踏上了回家的归程。提起回家团圆,大家都是归心似箭,...