• 亚博app 推理成本暴降70%!谷歌TPU强势追逐,性价比已追平英伟达
  • 亚搏体育官方网站 - YABO
亚搏资讯
热点资讯
推荐资讯

亚博app 推理成本暴降70%!谷歌TPU强势追逐,性价比已追平英伟达

发布日期:2026-02-19 15:32 点击次数:93

亚博app 推理成本暴降70%!谷歌TPU强势追逐,性价比已追平英伟达

在AI成本开支仍保管高位、但营业化压力不绝上涨确当下,市集心扉点正在发生一场悄然却潜入的改变:大模子还能不可连续“无视成腹地跑下去”。

据追风走动台,高盛最新发布的AI芯片盘考申报,并未延续市集熟悉的“算力、制程、参数范围”对比,而是从更贴近营业现实的角度切入——推理阶段的单元成本。通过构建一条“推理成本弧线”,高盛试图回复一个对AI产业至关报复的问题:在模子进入高频调用阶段后,不同芯片决议在折旧、能耗和系统诓骗率等不断下,每处理一百万个token究竟需要付出若干确实成本。

盘考论断指向了一次正在加快、但尚未被充分消化的变化:Google/Broadcom 的TPU正在马上放松与英伟达GPU在推理成本上的差距。从TPU v6升级至TPU v7,单元token推理成本下落约70%,使其在扫数成本层面与英伟达GB200 NVL72基本持平,部分测算情形下致使略具上风。

这并不料味着英伟达的地位被迫摇,但它明晰地标明,AI芯片竞争的中枢评价体系正在从“谁算得更快”,转向“谁算得更低廉、更可持续”。当熟谙逐步成为前期干预,而推理成为恒久现款流开端,成本弧线的斜率,正在取代峰值算力,成为决定产业神气的要害变量。

一、从算力最初到成本成果,AI芯片竞争的评价圭臬正在切换

在AI发展的早期阶段,熟谙算力险些决定了一切。谁能更快熟谙出更大的模子,谁就领无意代言语权。相关词,跟着大模子安适进入部署与营业化阶段,推理负载运行远远卓绝熟谙自己,成本问题被马上放大。

高盛指出,在这一阶段,芯片的性价比不再只由单卡性能决定,而是由系统层面的成果共同塑造,包括算力密度、互联成果、内存带宽以及动力耗尽等多重成分。基于这一逻辑构建的推理成本弧线露馅,Google/Broadcom TPU在原始狡计性能和系统成果上的越过,仍是足以在成本维度上与英伟达正面竞争。

比较之下,AMD和亚马逊Trainium在代际成本下落幅度上仍较为有限。从现阶段测算放手看,两者的单元推理成本仍显着高于英伟达和Google决议,对主流市集的冲击相对有限。

二、TPU成本跃迁的背后,是系统工程智商而非单点胁制

TPU v7罢了大幅降本,并非来自单一时代胁制,而是系统级优化智商的妥洽开释。高盛以为,亚搏跟着狡计芯片自己安适迫临物理极限,将来推理成本能否连续下落,将越来越依赖“狡计相邻时代”的越过。

{jz:field.toptypename/}

这些时代包括:更高带宽、更低延伸的麇集互联;高带宽内存(HBM)和存储决议的持续集成;先进封装时代(如台积电CoWoS);以及机架级责罚决议在密度与能效上的进步。TPU在这些方面的协同优化,使其在推理场景中展现出显着的经济性上风。

这一趋势也与谷歌自身的算力部署高度一致。TPU在Google里面责任负载中的使用比例持续上涨,已粗造用于Gemini模子的熟谙与推理。同期,具备熟谙软件智商的外部客户也在加快领受TPU决议,其中最引东谈主注主义案例是Anthropic向Broadcom下达的约210亿好意思元订单,相关居品瞻望将在2026年中运行托福。

不外,高盛同期强调,英伟达仍然掌捏“上市时代”上风。在TPU v7刚刚追平GB200 NVL72之际,英伟达仍是鼓舞至GB300 NVL72,并权略在2026年下半年托福VR200 NVL144。持续的居品迭代节律,仍是其保管客户黏性的要害筹码。

三、投资含义再均衡:ASIC崛起,但英伟达的护城河尚未被击穿

从投资视角看,高盛并未因TPU的快速追逐而下调对英伟达的判断。该机构仍保管对英伟达与Broadcom的买入评级,以为两者最径直绑定AI成本开支中最具可持续性的部分,并将恒久受益于麇集、封装和系统级时代升级。

在ASIC阵营中,Broadcom的受益逻辑尤为明晰。高盛已将其2026财年每股收益预期上调至10.87好意思元,较市集一致预期高出约6%,并以为市集仍低估了其在AI麇集与定制狡计鸿沟的恒久盈利智商。

AMD和亚马逊Trainium面前仍处于追逐阶段,但高盛也指出,AMD的机架级决议存在后发上风的可能性。瞻望在2026年末,基于MI455X的Helios机架决议有望在部分熟谙与推理场景中罢了约70%的推理成本下落,值得持续追踪。

{jz:field.toptypename/}

更报复的是,这份研报给出的并非“赢家通吃”的论断,而是一幅逐步明晰的产业单干图景:GPU连续主导熟谙与通用算力市集,而定制ASIC在范围化、可预测的推理负载中不绝渗入。在这一流程中,英伟达的CUDA生态与系统级研发干预仍组成坚实护城河,但其估值逻辑也将持续接管“推理成本下行”的现实磨练。

当AI确实进入“每一个token王人要算答复”的阶段,算力竞争终究要回到经济学自己。TPU成本暴降70%,并不是一次浅易的时代追逐,而是一次对AI营业形状可行性的要害压力测试。而这,能够恰是GPU与ASIC之争背后,市集最应正经对待的信号。

免责声明:本文试验与数据仅供参考,不组成投资漠视,使用前请核实。据此操作,风险自担。

------

QQ咨询

QQ: