
起头:半导体产业纵横 谈及 AI 芯片,公众泉源映入脑海的往往是 GPU 的身影。 GPU 在磨练和运行大 AI 模子方面一直占据主导地位,其执意的并行处贤达商让它在处理复杂算计任务时鸿章钜字。 可是由于一些原因,炙手可热的 GPU 正在濒临一些挑战与局限性,使其「AI 骄子」的地位渐渐受到动摇。 01 风口上的 GPU 对于 GPU 商场方法变动的原因,可归结为以下三轻便素: 第少许,GPU 已成为 AI 芯片鸿沟竞争的核焦躁点。当今,英伟达所产出的 GPU 主要被各大科技巨头所驾驭。 近日

起头:半导体产业纵横
谈及 AI 芯片,公众泉源映入脑海的往往是 GPU 的身影。
GPU 在磨练和运行大 AI 模子方面一直占据主导地位,其执意的并行处贤达商让它在处理复杂算计任务时鸿章钜字。
可是由于一些原因,炙手可热的 GPU 正在濒临一些挑战与局限性,使其「AI 骄子」的地位渐渐受到动摇。
01
风口上的 GPU
对于 GPU 商场方法变动的原因,可归结为以下三轻便素:
第少许,GPU 已成为 AI 芯片鸿沟竞争的核焦躁点。当今,英伟达所产出的 GPU 主要被各大科技巨头所驾驭。
近日,LessWrong 网站上发表了一篇博客,凭据公开数据对英伟达芯片的产量、各个 AI 巨头的 GPU/TPU 数目进行了臆测。
其中微软当今领有 75 万至 90 万块 H100 GPU,预测到 2025 年这一数字将飙升至 250 万至 310 万块。谷歌的进展通常强势,现阶段掌抓了 100 万至 150 万块 H100,来岁预测增多到 350 万至 420 万块。Meta 领有 55 万至 65 万块 GPU,预测将来一年将增长至 190 万至 250 万块。此外,亚马逊现时领有 25 万至 40 万块 GPU,预测将在 2025 年达到 130 万至 160 万块。而新兴公司 xAI 也在飞速崛起,预测从 10 万块 H100 增长至 55 万至 100 万块。
这些数据充分反馈出大型企业对 AI 算力的争夺已趋于尖锐化,尤其是微软和谷歌。
此外,Melius Research 的分析师 Ben Reitzes 的论说娇傲,这些巨头正在卓越购买英伟达的 GB200 芯片,其中微软下单量在 70 万至 140 万块之间,谷歌为 40 万块,亚马逊则购买了 36 万块,OpenAI 也出头出面,至少领有 40 万块 GB200 芯片。
科技巨头包揽英伟达 GPU 的同期,径直导致了中袖珍企业在获取 GPU 资源上濒临严峻挑战。
第二点,GPU 价钱的飙升使得这些科技巨头在采购芯少顷需要支付更高的成本。
据投行 Raymond James 的分析师臆测,H100 售价为 2.5 万至 3 万好意思元。 就算是价钱、订购数目王人按照区间的低端进行算计,微软也需要破耗逾越 180 亿好意思元用于购买 GPU。
微软、亚马逊、谷歌等科技巨头正在全球范围内加速布局 AI 算力,以保管其商场竞争力。据报谈,这些公司在 AI 研究神情和数据中心上的投资已逾越 400 亿好意思元,并预测将来十年的支拨将达到 1 万亿好意思元。
在繁多费钱的神情中,购买 GPU 即是各家确当务之急。
日前,埃隆·马斯克的东谈主工智能初创公司 xAI 仍是向英伟达胜利下单,订购了价值 10.8 亿好意思元的 GB200 AI 芯片,并凭借这笔多量来回取得了优先录用的权柄。
崇高的售价让科技巨头们压力倍增,叫苦不迭。
第三点,从另一角度来看,即便科技巨头暂且将成自身分置于次要塞位,英伟达自身的供应不及情状仍使这些科技巨头忧心不已。
当今,英伟达的 GPU 驾驭了约 80% 的 AI 半导体,制造在台积电进行。在后续的经由中,会诓骗 CoWoS 进行封装,但是 CoWoS 的产量当今是一个瓶颈。
另外,在 CoWoS 中,GPU 周围放弃了多个 HBM(高带宽内存),这些 HBM 是堆叠的 DRAM,也被以为是瓶颈之一。
在产能不及、巨头哄抢、售价崇高的布景下,万里长征繁多企业出手积极探寻英伟达 GPU 的替代品,试图破解 AI 芯片商场的一家独大的近况。
AMD 首席实践官苏姿丰 (Lisa Su) 也在前不久示意,跟着行业将元气心灵聚会于愈加程序化的模子想象,将有契机构建更多在可编程性和天真性方面要求不那么高的定制芯片。这种芯片将愈加节能、体积更小、成本更低。
「当今,GPU 是大言语模子的首选架构,因为 GPU 在并行处理方面至极高效,但在可编程性方面有所欠缺,」苏姿丰说。「五年多后它还会是首选架构吗? 我以为情况会发生变化。」
苏姿丰预测,五年或七年时刻内 GPU 还不会失势,但会出现 GPU 除外的新势力。
那么,除了 GPU,还有哪些类型的芯片能够胜任 AI 算计的任务呢?
02
AI 芯片的另外两种主流聘请
在近两年的时期波浪中,另外两种芯片——FPGA 与 ASIC,也渐渐走进了天下的视线。
FPGA(Field Programmable Gate Array,现场可编程门阵列),是一种半定制芯片。用户不错凭据自身的需求进行肖似编程。FPGA 的优点是既管制了定制电路的不及,又克服了原有可编程器件门电路数有限的过错,对芯片硬件层不错天真编译,功耗小于 CPU、GPU;过错是硬件编程言语较难,斥地门槛较高,芯片成本、价钱较高。FPGA 比 GPU、CPU 更快是因为其具有定制化的结构。
ASIC(Application Specific Integrated Circuit 特定用途集成电路)凭据家具的需求进行特定想象和制造的集成电路,其定制进度比较于 GPU 和 FPGA 更高。ASIC 算力水平一般高于 GPU、FPGA,但运转干涉大,专科性强缩减了其通用性,算法一朝篡改,算计智商会大幅下落,需要从新定制。
从成本角度看,GPU、FPGA、ASIC 三种硬件从左到右,从软件到硬件,通用性渐渐缩小、越专用,可定制化渐渐提高,相应的想象、斥地成本渐渐提高,但是单元成本表面性能越高。
从运算速率来看,由于 GPU 架构固定,硬件原生支撑的教唆也固定。而 FPGA 和 ASIC 则是可编程的,因此,GPU 的运算速率要媲好意思于 FPGA 和 ASIC。
从功耗和时延角度来看,GPU 的功耗远纷乱于 FPGA 和 ASIC。GPU 时延也高于 FPGA、ASIC。
FPGA 与 ASIC 的适用场景也不尽疏导,就角落 AI 而言,FPGA 确乎展现出了更高的适用性;ASIC 的主要上风在于其针对特定任务的高度优化,这经常会导致更高的性能和更低的功耗(在大批坐褥时),也正因此,在 AI 算计应用中,业内对于 ASIC 的呼声似乎要略高于 FPGA。
03
多家机构,看好 ASIC
12 月,博通的定制 ASIC 和英伟达 GPU 引起普通酌量。
摩根士丹利 12 月 15 日发布研报《AI ASIC 2.0:潜在赢家》,以为ASIC 凭借针对性优化和成本上风,有望冉冉从英伟达 GPU 手中争取更多商场份额。
跟着生成式 AI 应用的迅猛发展,全球 AI 算计需求呈现爆炸式增长。论说预测,到 2027 年,云表 AI 半导体商场范畴将达到 2380 亿好意思元,而在乐不雅情境下致使可能达到 4050 亿好意思元。
摩根士丹利预测,AI ASIC 商场范畴将从 2024 年的 120 亿好意思元增长至 2027 年的 300 亿好意思元,年复合增长率达到 34%。
尽管英伟达的 AI GPU 性能不凡,但摩根士丹利以为,云就业提供商如谷歌、亚马逊和微软,仍在积极推动 ASIC 想象。这背后的驱能源主要有两个。
泉源,是优化里面责任负载。通过斥地自界说芯片,CSP 不错更高效地闲适其里面 AI 推理和磨练需求。
其次,是更好的性价比。论说指出,天然英伟达的 GPU 具备执意的算计性能,但其硬件价钱崇高,卓越是在 AI 磨练过程中。比较之下,ASIC 的单元成本更低,尤其是在大范畴使用后。
巴克莱的另一份论说则预测,AI 推理算计需求将快速升迁,预测其将占通用东谈主工智能算算计需求的 70% 以上,推理算计的需求致使不错逾越磨练算计需求,达到后者的 4.5 倍。英伟达 GPU 当今在推理商场中市占率约 80%,但跟着大型科技公司定制化 ASIC 芯片约束线路,这一比例有望在 2028 年下落至 50% 傍边。
04
海外龙头,各自布局
博通,是 AI 商场的「新任骄子」
遏抑 12 月 13 日收盘,好意思股又一家万亿好意思元市值芯片公司出身。本日博通股价大涨逾越 24%,市值初次打破 1 万亿好意思元大关,也成为继英伟达和台积电之后,全球第三家市值过万亿好意思元的半导体行业公司。
博通股价大涨是在公司公布了好于预期财报之后。博通全年功绩娇傲,2024 财年,全年营收达 516 亿好意思元,同比增长 44%,其中 AI 和 VMware 两伟业务板块成为中枢增长引擎。
ASIC 定制就业是博通半导体业务的一项热切收入起头,卓越是在 AI 的驱动之下,博通来自与 AI 研究的 ASIC 定制就业营收正快速增长。
博通 CEO 陈福阳在近日的财报电话会上预测称,当今的三大科技客户将在 2027 财年破耗 600 亿至 900 亿好意思元购买博通供应的东谈主工智能组件。
业界分析,博通 ASIC 芯片的大客户包括谷歌、Meta;近期商场音问娇傲,苹果也有想象斥地 AI 就业器芯片,联结方很有可能亦然博通。
不仅如斯,从好意思国当今对中国的禁售条目来看,ASIC 芯片似乎耐久被摒除在外,博通也因此赓续受益。
跟着博通为云算计厂约定制更多 AI 芯片,这些厂商可能减少对英伟达芯片的依赖,有商场投资者记挂英伟达将来的芯片需求可能有所缓解。
Marvell 受到追捧
与博通业务模子类似的 Marvell 也在近日受到成本商场追捧。
12 月初,Marvell 仍是发布了 2025 财年第三财季财报,期内公司结束交易收入 15.16 亿好意思元,同比增长 7%、环比增长 19%。其中数据中心研究收入同比增长 98%、环比增长 25%,这是公司旗下扫数业务中独一结束同比收入增长的业务类型。
Marvell 总裁兼 CEO Matt Murphy 指出,这主要来自于 AI 定制化芯片需求撑持,此外还有云就业客户对于互联家具的赓续性需求。预测这种趋势将延续到 2026 财年(约指 2025 公积年份)。
仅在 12 月,Marvell 先是官宣与亚马逊云(AWS)扩大政策联结,布告一项为期五年、跨代际家具的联结想象,涵盖 Marvell 旗下定制 AI 芯片、DSP、数据中心互联光模块、以太网交换机管制决策等多种类型,以支撑 AWS 激动在数据中心算计、集结和存储等方面强化家具智商。不久还布告推出业界首款 3nm 高速(1.6Tbps)互联平台。
博通和 Marvell 有类似的产业定位,并不聚焦于 GPU 这类通用的大范畴并行算计芯片想象研发,而是更专注于匡助有芯片定制化需求的主流云就业厂商进行家具想象。这亦然 ASIC 芯片研究功绩高速成长的原因。
谷歌,自研 TPU
Google 早在 2013 年就神秘研发专注 AI 机器学习算法芯片,并用于云算计数据中心,取代英伟达 GPU。
这款 TPU 自研芯片 2016 年公开,为深度学习模子实践大范畴矩阵运算,如天然言语处理、算计机视觉和推选系统模子。Google 其的确 2020 年的而已中心便建构 AI 芯片 TPU v4,直到 2023 年 4 月才初次公开细节。
值得注重的是 TPU 是一种定制化的 ASIC 芯片,它由谷歌重新想象,并零星用于机器学习责任负载。
2023 年 12 月 6 日,谷歌官宣了全新的多模态大模子 Gemini,并丢出了另一个重磅炸弹——全新的自研芯片 TPU v5p,它亦然迄今为止功能最执意的 TPU。
随后在本年 5 月,谷歌又布告了第六代数据中心 AI 芯片 Tensor 处理器单元--Trillium。
据悉,除了英伟达所占据的 80% 商场,其余 20% 的绝大部分由各式版块的谷歌 TPU 所遏抑。谷歌自身不出售芯片,而是通过其云算计平台租用探问权限。
微软:推出基于 Arm 架构的通用型芯片 Cobalt、ASIC 芯片 Maia 100
2023 年 11 月,微软在 Ignite 时期大会上发布了首款自家研发的 AI 芯片 Azure Maia 100,以及应用于云表软件就业的芯片 Azure Cobalt。两款芯片将由台积电代工,收受 5nm 制程时期。
Cobalt 是基于 Arm 架构的通用型芯片,具有 128 个中枢,Maia 100 是一款专为 Azure 云就业和 AI 责任负载想象的 ASIC 芯片,用于云表磨练和推理的,晶体管数目达到 1050 亿个。这两款芯片将导入微软 Azure 数据中心,支撑 OpenAI、Copilot 等就业。
清雅 Azure 芯片部门的副总裁 Rani Borkar 示意,微软已出手用 Bing 和 Office AI 家具测试 Maia 100 芯片,微软主要 AI 联结伴伴、ChatGPT 斥地商 OpenAI,也在进行测试中。
不外,微软并不以为我方的 AI 芯片不错普通替代英伟达的家具。有分析以为,微软的这一勉力淌若胜利的话,也有可能匡助它在将来与英伟达的谈判中更具上风。
除了前述几家公司,Meta 等科技行业率领者正积极加速自主研发芯片的措施。这些勉力不仅限于 ASIC 鸿沟,还包括 FPGA 和 RISC-V 等多个标的,旨在缩小对英伟达时期的依赖。
在科技行业中,不只单是这些头部企业有所行为。摩根士丹利在研究论说里对全球 ASIC 供应链伸开了梳理,而且笃定了六大潜在的上风方:
ASIC 供应商方面,除了博通,Alchip(世芯电子) 和 Socionext 也被视为 ASIC 商场的后劲股。其中,Alchip 由于与 AWS 的深度联结,预测将在 2026 年权贵升迁商场份额。
电子想象自动化器具方面,Cadence 有望结束结构性增长。
代工场方面,台积电过火供应链伙伴将从 ASIC 想象与制造的快速增长中受益。
测试就业方面,Advantest 是 AI 芯片测试鸿沟的最初者,其在 AI 树立测试方面的专注将为其带来权贵增长。
HBM 方面,三星电子口角英伟达 HBM 商场份额最初者,将从 ASIC 需求增长中获益。
05
苹果,屡试「新果」
本年 7 月,苹果公司发布 iPhone AI 的首个预览版,随后发布论文,称其东谈主工智能模子是在谷歌的 TPU(张量处理单元)上磨练的。论文中先容了为支撑 Apple Intelligence 功能而斥地的基础言语模子,包括一个想象用于在树立上高效运行的约 30 亿参数模子和一个基于专有云算计的云侧大模子。
近日,苹果公司在亚马逊的 AWS Reinvent 大会上又高调布告将使用亚马逊自家定制的 AI 芯片进行模子磨练。凭据苹果机器学习与东谈主工智能高等总监 Benoit Dupin 的说法,苹果正在评估亚马逊最新的 Trainium2 芯片,尤其是其在预磨练「苹果智能」(Apple Intelligence)模子方面的后劲。
这一迹象标明,在磨练顶端东谈主工智能方面,大型科技公司正在探索除英伟达 GPU 除外的其他替代决策。
遥远以来开云官网切尔西赞助商,东谈主工智能磨练主要依赖于价钱崇高的英伟达图形处理器。可是,云就业提供商与初创企业正积极研发成本更低的替代决策,并探索可能结束更高效处理的新路线。苹果收受定制芯片的作念法,或者在向其他企业传递一个信号:非英伟达的磨练决策通常也能胜利。