2026年马年春节,互联网大厂的“红包战”如期上演。百度撒下5亿,腾讯元宝豪掷10亿,阿里更是祭出30亿免单的“钞能力”。不过“撒钱”只是“开胃菜”,紧随而来的则是参与者更多、频率更密集的国产AI新品“春节档”:
2月14日,字节跳动发布豆包大模型2.0系列,这是继Seedance 2.0视频模型和Seedream 5.0 Lite图像模型之后打出的春节“第三弹”。智谱已在2月11日发布“系统架构师”级别的底座模型GLM-5;MiniMax紧随其后,于2月12日上线并开源文本模型M2.5;连一向低调的DeepSeek,也在几天前进行版本更新。在此之前,阶跃星辰发布Step 3.5 Flash,阿里发布Qwen3-Coder-Next,且有望在春节期间发布Qwen 3.5。
每一次发布都是一次卡位,每一次迭代都是一次重塑行业格局的尝试。这一波覆盖文本、图像、视频多模态的AI“最强春节档”已经拉开大幕。
▌多模态大模型接连面世 Token需求出现“通胀”
一年多前,字节内部曾判断,AI对话类产品可能只是AI产品的“中间态”,长期更理想的产品形式,大概率需要更视觉化的用户体验、更低的用户使用门槛。因此彼时的字节选择提升即梦的产品优先级,尝试打造“AI时代的抖音”。
或许也正是因此,一年多以后,在字节的这次春节档“三连弹”中,最先出场的不是最为大众所熟悉的豆包,而是视频模型Seedance 2.0。
而从曾经和文本大模型的“聊几秒”到如今视频大模型的“看几秒”,算力消耗规模正在快速膨胀——从单条视频来看,Seedance 2.0 生成一条10秒、1080p的视频,大致要消耗35万token。
Seedance 2.0的算力消耗增长并非孤例。春节档的这轮密集发布,对各家厂商而言不仅是品牌宣传的窗口期,也是一场对底层算力储备的极限压力测试。随着越来越多的多模态和长文本大模型面世,势必将进一步推高Token需求。
国联民生证券指出,Token需求正在发生“通胀” 。这种“通胀”并非是指Token本身变贵,而是指单位时间内、单位用户的Token消耗结构性上升。
数据显示,火山引擎的大模型日均Token调用量已从2024年底的2万亿增长至2025年底的63万亿;阿里云外部客户2025年日均Token调用也已接近5万亿,2026年目标至少15-20万亿,内部业务日均调用则计划从16-17万亿拉到100万亿。从全行业看,中国整体日均Token消耗2024年初为1000亿,2025年中突破30万亿,2026年2月主流大模型合计日均Token消耗已到180万亿级别。




还没有评论,来说两句吧...