算力告急、项目延误!谷歌对Meta实施算力限流

来源:搜狐新闻 分类:手机
算力告急、项目延误!谷歌对Meta实施算力限流

文章配图-1

首图来源:Getty Images

谷歌对Meta实施算力限制,不过是全球AI算力紧张的一个缩影。当算力资源捉襟见肘,即便是科技巨头也难以独善其身。

据《金融时报》披露,谷歌近期对Meta使用其Gemini人工智能模型施加了限制,缘于谷歌无法满足Meta对计算资源的庞大需求。这一事件预示着,即便是全球最大的AI服务提供商,同样会受到基础设施建设的掣肘。

三位知情人士确认,谷歌在今年3月前后通知Meta,无法满足其全部Gemini计算能力需求,导致Meta的多项内部AI项目计划被打乱。多位知情人补充道,由于谷歌的算力限制仍在持续,且公司正着力压缩AI成本,Meta已敦促员工更精细化地运用token——作为衡量AI使用量的标准。Meta近期曾预告,到2026年,仅“内部AI使用”一项的投入就将突破数十亿美元,并计划在2027年推行基于预算和配额的token管理机制。

Meta遭遇算力瓶颈并非个案。多位消息人士透露,其他与谷歌达成长期合作的客户也遭遇了不同程度的算力限制,而Meta因需求体量巨大,受到的冲击最为显著。

谷歌对大客户算力访问的限制,让我们看到了整个AI行业日益严峻的基础设施困境。这场风波反映出AI推理工作负载的迅猛增长,已成为行业面临的重大挑战。

虽然芯片、数据中心和电力领域投入了巨额资金,但即便是顶尖科技公司,也难以确保跟上对先进模型和AI服务的增长需求。

来源:路透社

一位知情人士指出,正是由于来自Meta等大客户的需求,谷歌才争分夺秒地寻找新的算力补充。

谷歌近期与埃隆·马斯克旗下SpaceX敲定了价值不菲的算力租赁合作。从今年10月起,谷歌每月将向SpaceX支付9.2亿美元(约合人民币63亿),租赁其数据中心用于AI运算的算力。

这份协议有效期直至2029年6月,涉及约11万片英伟达GPU,以及配套的CPU、内存设备等。根据条款,算力将在9月前逐步提升,扩容期间享受折扣价格。

对于谷歌而言,这笔交易解决了燃眉之急。谷歌云发言人表示,达成该协议是为了“确保我们获取过度的算力资源,满足客户对代理平台Gemini Enterprise激增的需求,这一增长甚至超出了我们的预期”。

4月发布的第一季度财报显示,谷歌云业务营收首次突破200亿美元,而已签约但尚未交付的云服务合同积压额环比增长了近一倍,达到4600多亿美元。

“计算能力的短缺是我们在短期内面临的主要挑战,”谷歌CEO桑达尔·皮查伊在财报发布时坦言。“若能顺利满足需求,我们的云业务收入本会是更高水平。”

在此形势下,Meta受到的影响尤为明显。知情人士透露,正是由于Meta对算力的极致需求,促使谷歌加速拓展外部算力渠道。随着企业纷纷部署聊天机器人、编程助手和AI智能体,推理工作负载——即模型训练完成后的实际应用算力消耗——正成为行业的核心矛盾点。

据消息人士透露,Meta最初选择使用Gemini,是看重其综合表现优于自研的Llama开源模型。Gemini在Meta内部被广泛部署,涵盖平台安全审核(包括识别诈骗内容、清理有害信息)、客户服务及广告聊天机器人等多个场景。此外,Gemini还与其他公司产品如Anthropic的Claude协同使用,承担部分内部工作流程和编码任务。

面对紧缩的算力供应,Meta正加速转向自研模型。多位知情人表示,近期已启动优先使用自研模型的战略。

相关推荐