国内多数AI模型训练使用的中文数据占比已超60%-每日速讯
2025-08-23 12:38:52
来源:新华网
(相关资料图)
国家数据局局长刘烈宏表示,我国人工智能的快速发展,与我国高度重视数据工作是密不可分的。作为人工智能发展的核心要素之一,数据在推动“人工智能+”过程中发挥着关键作用,高质量数据集的建设至关重要。
“在人工智能时代,Token,也就是大家通常所说的词元,是处理文本的最小数据单元,如同互联网时代大家所说的‘流量’。”刘烈宏介绍,2024年初,我国日均Token的消耗量为1000亿,到今年6月底,日均Token消耗量已经突破30万亿,一年半时间增长了300多倍,反映了我国人工智能应用规模的快速增长。
据介绍,截至今年6月底,我国已经建设高质量数据集超过3.5万个,总体量超过了400PB(1PB可存储约5亿张2MB大小的高清照片),400PB的总量相当于中国国家图书馆数字资源总量的140倍左右。
人工智能模型的训练也推动了数据交易需求的攀升。截至今年6月底,各地高质量数据集累计交易额近40亿元,数据交易机构挂牌的高质量数据集总规模达到了246PB。
下一步,国家数据局将通过体系化布局持续推进高质量数据集建设,加快打造具身智能、低空经济、生物制造等重点领域数据高地,推动全社会强化数据要素价值认同,加快推进数据要素价值共创,培育“为优质数据买单”的市场共识。
关键词:
相关阅读
版权和免责申明
凡注有"环球传媒网"或电头为"环球传媒网"的稿件,均为环球传媒网独家版权所有,未经许可不得转载或镜像;授权转载必须注明来源为"环球传媒网",并保留"环球传媒网"的电头。
资讯
- 焦点快看:绿联科技: 关于股东询价转让结果报告书暨持股5%以上股东权益变动触及1%整数倍的提示性公告内容摘要
- 芯朋微:融资余额4.85亿元,创历史新高(08-22)
- 南方中证500ETF联接(LOF)A:净值1.9168元增1.69%
- 【快播报】宁波韵升:上半年净利润同比增长179.83%
- 三台县: 秸秆"变废为宝" 实现环保经济双赢_头条焦点
- 视焦点讯!国家能源局:截至2025年7月底 我国电动汽车充电基础设施总数同比增长53%
- 国家外汇管理局:在16省市开展绿色外债业务试点
- 持续暴雨预警,8月下旬了华北为何还这么多雨?
- 每日关注!2025年威海市技工院校烹饪专业师资培训举办
- 动态焦点:生意社:上海期货交易所8月21日不锈钢仓单下跌