前些日子在小黄鱼上卖出了一批三星服务器级内存条,每一条定价1050元,实实在在赚了五倍利润。造成这次价格飙升的缘由,众人心里都清楚得很,AI使用需求激增,生产制造跟不上了。不过,你是否琢磨过,英伟达、苹果这些科技领域翘楚,明明知道内存涨价、供应紧张,却只能眼睁睁看着韩国企业掌控话语权?关键信息藏在两个新词中:一个是令无数硬件工程师倍感煎熬的"内存墙",另一个则是让全球科技企业和普通消费者不得不承受的"内存税"。
关于内存墙的来龙去脉,我们必须先破除一个普遍存在的认知误区。很多人觉得,只要处理器性能强大,AI就能高效运行。这种想法在个人电脑发展初期或许行得通,但在AI应用领域完全站不住脚。不妨将芯片处理器比作饕餮大胃王,它拥有全行业顶尖的消化能力,每秒能处理数百亿数据,而内存则是储存信息的巨型粮仓。表面上看这种组合再合适不过,但真正的问题出在两者之间的衔接环节。大胃王和粮仓之间并非畅通无阻的高速公路,只连接着一条细细的数据通道。大胃王吃得多快又有何用?它每处理完一组数据,都要耐心等待信息从通道中缓缓传输过来。
计算机领域将这种瓶颈现象称为"内存墙"。最新发布的AI行业报告显示,英伟达GPU从A100发展到B200,计算能力提升了约8倍,但内存传输带宽仅增加4倍,容量增长2.4倍。算力与内存带宽之间的速度差距日益扩大,导致大部分时间里GPU都在闲置等待数据传输。内存税的由来又是什么?过去内存涨价时,人们很少提及"内存墙",为何在AI、ChatGPT爆发后,这堵无形之墙让所有人都叫苦不迭?
关键在于大模型的工作方式与传统应用程序截然不同。以前运行《黑神话悟空》或剪辑4K视频时,显卡主要负责图像计算等复杂操作,虽然需要强大的算力,但每次传输的数据量相对有限。而大模型本质上是一种高级文字游戏,在极短时间内的预测过程中,显卡必须完整读取大模型的所有参数。顶级大模型的参数量可达上万亿个。AI每生成一个字符,显卡就需要将全部参数从内存中调取一遍,再写回去。此时算力强弱已不再重要,只要数据传输通道不够宽敞,显卡在生成文本间隙仍要花费绝大部分时间等待数据。这就是英伟达H200即使算力超群,一旦单卡内存配置不足,就必须堆叠多张显卡才能完成任务的真相。
全球AI服务器都在疯狂增加内存配置,只为让那根数据通道变得更粗。科技企业为突破这堵墙,已探索出三种主要方案,目前只有高带宽内存HBM真正实现商业化应用。既然数据通道太细太长,不如将内存直接堆叠在处理器上方,像建筑群一样垂直安装,通过微米级触点直接连接GPU芯片。这种方案确实解决了传输难题,但HBM生产过程极为耗费晶圆,加工一份HBM需要耗费普通内存三倍的资源。即便三大内存制造商全力扩产,到2026-2027年,HBM产能仍将因长期协议被大型企业预购而不足,这就是为何巨头们还要与普通消费者争夺内存,导致内存条价格居高不下的原因。掌握产能和技术的一方,就掌握了向整个行业甚至全人类征收"内存税"的主动权。这种特殊的定价权控制,正由韩国企业牢牢攥在手中。
英伟达在AI芯片研发领域勇当先锋,而韩国双雄则坐收渔利。英伟达显卡卖得越是火爆,只要海力士或三星调整HBM价格或宣布产能紧张,英伟达就必须将部分利润让渡给内存供应商。在AI芯片成本构成中,除了核心GPU运算单元外,HBM占比最高。随着大模型对带宽需求的不断攀升,显卡上搭载的HBM数量呈现指数级增长,这种不平衡的供应链关系让全球用户都承受着难以言说的负担。





