在前所未有的规模下,Omdia的最新估计显示,今年AI服务器将占据整体服务器资本支出的超过一半(66%),这一数字确实引人注目。Galabov指出,我们正见证着前所未有的颠覆性趋势。基于先前的支出预测,我们又增加了大约100亿美元的投资。
这笔巨额投资不仅仅来自三大云服务巨头——亚马逊云科技、Azure和Google Cloud,还包括了前十大云服务提供商。同时,越来越多的公司,如CoreWeave,也在专业AI云服务上进行了大量投资。
尽管66%的服务器支出用于支持AI硬件,但这些系统尚未占据云数据中心的大部分部署比例。根据Omdia的数据,AI服务器仅占出货量的19%,这反映出这些配备GPU的设备的高昂成本。
这引发了新的疑问:所有这些AI系统的支出是否会影响云服务商对现有服务器的更新能力。实际情况可能更加复杂,因为各大云基础设施运营商还在定制化芯片上投入了数十亿美元,以期提高平台的运行效率。
Galabov强调,在最大的云服务提供商中,我们正在积极整合其非AI服务器基础设施,以帮助他们降低非AI相关的成本。他举例说,谷歌对其视频处理服务器进行了优化,开发了名为视频编码单元(VCU)的定制化处理器,针对H.264视频进行了优化。一个协处理器甚至能取代两台英特尔Skylake服务器。
这意味着在下一轮更新中,谷歌不再用新服务器一对一替换Skylake服务器,而是用一套配置有12个VCU的系统来替换多台旧服务器。此外,谷歌还针对更高效的视频压缩格式VP9优化了该处理器,一台拥有20块VCU的服务器可以直接取代多个机架的Skylake服务器。
Galabov解释说,这意味着他们无需更新多个服务器机架,而是可以用一台针对特定应用程序高度加速和优化的服务器来替代,从而大幅节约资金。我们预计这种情况会越来越多。Meta也在进行类似的尝试,这很可能成为一种普遍趋势。数据库和Web基础设施应用程序也可能经历类似的优化周期。
与此同时,一些企业并没有放弃自己的基础设施,反而出现了将部分工作负载带回内部的趋势,即所谓的“云遣返”。其中一个原因是,许多公司发现使用公有云资源的成本可能并不比自主运营IT系统低,甚至往往更高。这背后有多种因素的影响(例如亚马逊云科技的计费方式常被指责过于复杂),但多数情况下,主要问题似乎是资源管理不善。
Galabov表示,基础设施成本膨胀和利用不足导致许多企业转向云服务。但在转向云服务后,一些用户继续沿用过去的管理实践,保留大量冗余基础设施容量,最终导致为未使用的资源付费。
因此,Galabov认为未来市场应更多关注设施规模的合理性,或更合理地分配工作负载。Omdia将这种做法称为“云智能”,而Galabov表示这种表达已经成为行业术语。至少在不久的将来,Galabov相信企业将越来越多地依赖IT即服务平台(例如Dell Apex或HPE Greenlake)进行内部计算。
这些平台能够为客户提供与公有云服务相同的好处,同时设施又位于他们自己的数据中心或主机托管站点内。供应商提供完整且预先配置的基础设施,负责提供管理服务,并设有随用随付等计费选项。
他表示,“我个人认为不会出现大规模的下云趋势,这更像是小规模的优化手段。”这方面的证据是,企业在云基础设施服务上的支出比以往任何时候都更加强劲,今年第一季度增长了21%,达到760多亿美元。目前,所有这些支出中约有72%流向了三大云服务商。然而,同一项调查也发现,Snowflake、MongoDB和甲骨文等二线云运营商的同比增长率更高。
也许这些挑战者以及CoreWeave等专业AI提供商将逐渐削弱三大云巨头的主导地位,或者说目前针对三大厂商的反垄断审查将进一步推动市场开放,让云领域的竞争更加激烈。无论最终结果如何,云服务都将坚定地继续发展。
发表评论 取消回复