核心產品
TPU v5e AI加速器、A3 GPU叢集(基於H100)
詳細簡報▼ 展開
谷歌LLC運營Google Cloud Platform(GCP),按營收計是繼AWS和Azure之後全球第三大雲端平台。谷歌在AI晶片供應鏈中佔據獨特地位,既是AI算力的超大規模雲端買家,又通過已發展至第六代的張量處理器(TPU)項目成為晶片設計商。 谷歌的TPU項目於2013年作為內部項目啟動,旨在加速神經網路推理工作負載——源於對CPU和GPU在深度學習主導運算矩陣乘法上效率低下的認識。第一代TPU於2015年內部部署,2017年公開披露。從TPU v2到TPU v5e/v5p,已從僅推理演進為資料中心規模的完整訓練+推理能力。 TPU供應鏈:①谷歌硬體團隊定義晶片架構和微架構;②Broadcom作為ASIC設計合作夥伴,提供物理設計和流片專業知識;③台積電在先進節點製造晶片(TPU v4在N7,TPU v5e在N4);④廣達電腦等ODM將其組裝成定制機架級系統。這一端到端的定制技術棧使谷歌能夠以現成英偉達硬體無法比擬的方式為transformer工作負載優化系統效率。 對於TPU不夠理想的工作負載——特別是客戶自帶英偉達訓練模型的第三方AI模型服務——谷歌雲分別提供基於英偉達A100、H100和H200 GPU的A2、A3和A3 Mega實例。因此谷歌既是TPU開發商,也是重要的英偉達GPU客戶。 谷歌與Broadcom的深度整合(網路ASIC、交換機晶片和TPU聯合設計)使谷歌-Broadcom-台積電三角成為AI基礎設施中最具戰略重要性的供應鏈關係之一。
關鍵路徑 — 從原料矽到部署
晶圓代工
TSMC ▲
CoWoS先進封裝、N3/N2邏輯
晶片設計
Broadcom
TPU ASIC(谷歌)、網路ASIC
電力與冷卻
Vertiv ▲
液冷、UPS、PDU系統
雲端服務商
Google Cloud
TPU v5e AI加速器、A3 GPU叢集(基於H100)
AI消費者
Anthropic
Claude 3.5 Sonnet、Claude 3 Opus(前沿AI模型)