过去的几个月里,随着“龙虾”智能体的爆火,全球的Token调用量迎来了新一轮的暴涨。
3月24日,国家数据局局长刘烈宏介绍,截至今年3月,中国日均Token调用量已经突破140万亿,较2024年年初增长超过1000倍。他同时公布了Token的中文译名——“词元”。
Token,也就是“词元”,这个近期突然走红的词,到底是什么?词元为什么会成为AI时代的关键指标?它的调用量高又说明了什么?
AI大模型的Token是什么?
Token是AI大模型处理信息的基本单位,我们以字为单位来读书写字,对于大模型,这个输入输出的单位就是Token。在AI的眼里,一个Token可能是零点几个汉字、单词,也可能一个标点、数字或者符号。它就像AI时代手机的流量一样,每一个AI模型厂商都会提供自己的Token,并且以它的消耗量为单位向用户收费。
无论是用户的提问,还是AI生成的一段代码,最终都要被拆解成Token来完成运算。就拿最近火爆的“养龙虾”来说,想让它变得更聪明,就得为大模型的服务买单,本质上就是在购买Token的使用量。
日均Token调用量的大量增加,充分表明中国的人工智能发展进入了快速增长阶段,应用场景在不断深化。
4.69万亿Token!中国AI大模型调用量连续两周领跑全球
全球最大AI模型API聚合平台OpenRouter最新发布的数据,截至3月15日,中国AI大模型的周调用量达到4.69万亿Token,连续第二周超越美国。全球调用量排名前三的位置,更是被中国模型包揽。
国产大模型MiniMax M2.5连续五周霸榜全球大模型调用量冠军,在公司总部的办公区,产品研发人员向记者展示了直观的价格差距。“达到同样能力水平的海外模型跟我们相比,价格可能有十几倍的差距。”

我们要知道,Token并不是凭空产生的,它是由高性能的GPU在消耗大量的电能,完成数千亿次的推理运算后产生的数字资产。每生成一个Token都对应着真实的推理过程,也对应着真实的电力消耗和算力消耗。

而中国大模型公司之所以能够把Token价格做得更低,主要原因:
第一是我们的电力优势。中国拥有更完善的电力基础设施和技术体系,尤其是在西部地区丰富的新能源绿电,正在与数据中心算力、枢纽加快耦合,把电直接转化成AI时代的新型服务能力。
第二是技术能力。近年来中国科技企业在推理芯片、模型架构和系统优化上持续突破,这意味着面对同样一个问题,中国的大模型往往可以用更少的算力,更短的时延,更高的能效,就把答案给算出来。

有人说Token将是AI时代新的能源单位,中国电力、中国算力正在以一种全新的方式参与着全球的竞争。
词元消耗量是人工智能产业发展“晴雨表”
在人工智能时代,用户输入的每一个字,大模型生成的每一段话、识别的每一幅图像,都在消耗词元。

国家数据局专家咨询委员会委员张向宏介绍,日均超140万亿的词元调用量,相当于1000万亿个中文词汇,也相当于250个中国国家图书馆的资源量。

国家发展改革委国家信息中心人工智能处工程师蔡驰宇介绍,词元日均调用量大幅增长,充分表明人工智能正加速从实验室走向千行百业和千家万户,变成了实实在在的生产力工具,像水、电、网络一样,成为智能社会运转的基础资源。词元的消耗量是人工智能产业发展的重要指标和“晴雨表”。
以词元计费为基础的
新型商业逻辑加速演进

围绕词元的调用、分发与结算,一套新的价值体系正在加速演进形成,并成为人工智能产业可能变现的重要路径。
蔡驰宇介绍,过去,一家企业使用信息服务,需要购买信息软件;现在一家企业使用信息服务,可能直接调用大模型接口,用多少词元,就付多少费用,以词元消耗量的多少作为计费依据。
与此同时,专家表示,词元消耗量增长也对电力资源提出了更高需求。今年的《政府工作报告》提出,实施算电协同等新基建工程。专家介绍,算电协同的本质含义,就是要使用我国具有超前优势的绿电来发展算力产业和人工智能产业。
近期热门视频
作者:央视财经








