AI遇上最强春节档 Token通胀已成必然？

2026年马年春节，互联网大厂的“红包战”如期上演。百度撒下5亿，腾讯元宝豪掷10亿，阿里更是祭出30亿免单的“钞能力”。不过“撒钱”只是“开胃菜”，紧随而来的则是参与者更多、频率更密集的国产AI新品“春节档”：

2月14日，字节跳动发布豆包大模型2.0系列，这是继Seedance 2.0视频模型和Seedream 5.0 Lite图像模型之后打出的春节“第三弹”。智谱已在2月11日发布“系统架构师”级别的底座模型GLM-5；MiniMax紧随其后，于2月12日上线并开源文本模型M2.5；连一向低调的DeepSeek，也在几天前进行版本更新。在此之前，阶跃星辰发布Step 3.5 Flash，阿里发布Qwen3-Coder-Next，且有望在春节期间发布Qwen 3.5。

每一次发布都是一次卡位，每一次迭代都是一次重塑行业格局的尝试。这一波覆盖文本、图像、视频多模态的AI“最强春节档”已经拉开大幕。

▌多模态大模型接连面世 Token需求出现“通胀”

一年多前，字节内部曾判断，AI对话类产品可能只是AI产品的“中间态”，长期更理想的产品形式，大概率需要更视觉化的用户体验、更低的用户使用门槛。因此彼时的字节选择提升即梦的产品优先级，尝试打造“AI时代的抖音”。

或许也正是因此，一年多以后，在字节的这次春节档“三连弹”中，最先出场的不是最为大众所熟悉的豆包，而是视频模型Seedance 2.0。

而从曾经和文本大模型的“聊几秒”到如今视频大模型的“看几秒”，算力消耗规模正在快速膨胀——从单条视频来看，Seedance 2.0 生成一条10秒、1080p的视频，大致要消耗35万token。

Seedance 2.0的算力消耗增长并非孤例。春节档的这轮密集发布，对各家厂商而言不仅是品牌宣传的窗口期，也是一场对底层算力储备的极限压力测试。随着越来越多的多模态和长文本大模型面世，势必将进一步推高Token需求。

国联民生证券指出，Token需求正在发生“通胀” 。这种“通胀”并非是指Token本身变贵，而是指单位时间内、单位用户的Token消耗结构性上升。

数据显示，火山引擎的大模型日均Token调用量已从2024年底的2万亿增长至2025年底的63万亿；阿里云外部客户2025年日均Token调用也已接近5万亿，2026年目标至少15-20万亿，内部业务日均调用则计划从16-17万亿拉到100万亿。从全行业看，中国整体日均Token消耗2024年初为1000亿，2025年中突破30万亿，2026年2月主流大模型合计日均Token消耗已到180万亿级别。

正文

AI遇上最强春节档 Token通胀已成必然？

发表评论取消回复

还没有评论，来说两句吧...

目录[+]