海外研选|小摩:Token用量、GPU租赁和DRAM价格齐升 AI基建需求仍获支撑

来源:搜狐新闻 分类:财经
海外研选|小摩:Token用量、GPU租赁和DRAM价格齐升 AI基建需求仍获支撑

文章配图-1

财联社7月3日讯(编辑 夏军雄)摩根大通发布最新《数据中心观察》报告称,大模型调用量迅猛增长,Token支出再度加速,非超大规模云厂商市场的GPU租赁费用持续上升,DRAM现货价格依旧坚挺。

报告指出,模型价格下调并未使AI需求减弱,反而在降低使用门槛和扩展应用场景上,推动了推理需求的进一步释放。

从OpenRouter数据看,6月LLM Token总量环比增长70%,远超5月的33%和4月的5%;同比增速达到20倍,高于5月的12倍和4月的15倍。Token支出也同步回升,6月环比增长70%,同比增长16倍,扭转了前两个月增速放缓的局面。(OpenRouter数据显示,6月全球周度Token用量激增至约45万亿,其中非美国模型的增速明显快于美国模型)。

从商业角度看,这说明模型价格下降并未造成市场收入萎缩。6月平均Token价格环比增长7%,但同比仍下降5%;同比降幅已小于5月的21%和4月的24%。换句话说,行业正处于长期单位价格下行阶段,但价格下滑速度正在减缓,而使用量的增长速度远远快于价格调整速度。(平均Token价格走势图)。

摩根大通据此分析,在其样本和简化假设下,即使采用较保守的Token价格,模型提供商的单位经济性依然呈现改善态势。这并非表示所有模型公司都已实现稳定盈利,但至少证明市场需求端尚未出现“价格战压垮商业模式”的情况。

美国模型份额有所回落,但仍然占据主要收入来源

值得注意的是,Token使用量与收入贡献之间显现出明显差异。

6月,美国模型,包括OpenAI、Anthropic、谷歌和xAI等,占OpenRouter总Token量的35%,低于5月的46%和4月的56%。其Token量环比增长30%、同比增长8倍,增速虽快,但弱于整体市场。

这意味着以DeepSeek、MiniMax、MiMo、GLM等为代表的中国模型和低成本模型,正在开发者、初创企业、代理式编程等对成本高度敏感的场景中,迅速扩大使用份额。

按Token用量计算, 6月排名前五的模型分别为DeepSeek V4 Flash、MiMo-V2.5、MiniMax M3、Hy3 preview和Claude Opus 4.7,合计占总Token量的45%。(Token用量排名前20的大模型图)

但如果从支出端观察,美国模型依然占优。美国模型贡献了85%以上的Token支出,6月相关支出环比增长65%、同比增长14倍。按Token支出计算,排名前五的模型依次为Claude Opus 4.7、Claude Opus 4.8、GPT-5.5、Claude Sonnet 4.6和GLM 5.2,合计占总支出的75%。

其中,Claude Opus 4.7是唯一同时进入Token使用量和支出前五的模型。这一现象反映出市场正在形成双层结构:低成本、开源或中国模型更擅长扩大调用规模;高性能、闭源和企业级模型则仍掌握更多高价值应用和付费需求。

GPU租赁价格上涨,非云巨头市场依然缺算力

摩根大通依据彭博数据,6月非超大规模云厂商市场的GPU租赁价格继续攀升。A100平均租赁价格为每GPU小时1.63美元,环比上涨6.3%,已连续第五个月上涨;H100平均价格为2.72美元,环比上涨3.7%,连续第七个月上涨;B200平均价格为5.33美元,环比上涨2.7%。

三类GPU同步涨价,表明AI算力需求并未只集中在微软、亚马逊、谷歌和Meta等超大规模云厂商。 大量模型初创公司、企业客户、GPU云服务商

相关推荐