Alibaba Cloud

Alibaba Cloud Intelligence Group

🇨🇳
云服务商🇨🇳 CNBABA · NYSE | 9988 · HKEX
alibabacloud.com

核心产品

阿里云AI、含光800 NPU、通义千问

瓶颈状态

🔴 2023年10月BIS规则实施后无法获得英伟达H100/H200

追踪供应链 →
详细简报▼ 展开

阿里云是阿里巴巴集团(纽交所/港交所: BABA)的云计算子公司,是中国最大的云服务提供商,也是全球收入规模仅次于AWS和Azure的第三大云服务商。成立于2009年,2024财年年收入约150亿美元,AI驱动的工作负载占比持续增长。云业务在中国大陆、香港、新加坡、日本、德国、澳大利亚和美国均设有数据中心,是亚洲云服务商中全球分布最广的之一。 阿里巴巴的AI芯片战略涵盖三个硬件层次。第一,含光800 NPU于2019年发布,由台积电12nm工艺代工,由阿里巴巴达摩院专为电商推荐、图像搜索和自然语言推理工作负载设计。含光800驱动淘宝和阿里巴巴广告系统,每天处理数万亿次推理查询。它不是通用训练芯片,而是高度专用的推理加速器——这一差异化方法降低了阿里巴巴核心工作负载对外部GPU的依赖。第二,阿里云原本运营NVIDIA A100和H800集群用于大规模AI训练;但2023年10月BIS出口管制扩大后,无法再获得H100/H200出口,已转向英伟达中国合规版H20 GPU。第三,阿里云已签约华为昇腾910B集群,作为需要高于H20互连带宽的工作负载的国产备选方案。 阿里巴巴的通义千问(Qwen)大模型家族于2023年推出,已成为中国部署最广泛的模型系列之一。Qwen模型覆盖0.5B至72B参数规模,包含多模态变体(Qwen-VL)和代码专用版本(Qwen-Coder)。2024年6月发布的Qwen2系列在与LLaMA 3和Mistral等国际开放权重模型的基准测试中表现竞争性。阿里巴巴以宽松许可证开源了大部分Qwen变体,截至2025年初,其在Hugging Face上的下载量使之成为最受欢迎的中文开放权重模型系列。 出口管制对阿里云的影响是多维度的。H20 GPU——英伟达的降规中国合规产品——与H100/H200相比,NVLink带宽和GPU间互连性能大幅降低,使大规模训练效率下降。阿里巴巴的应对措施是加大投入模型效率技术、针对互连带宽减少优化的分布式训练框架,以及通过更长训练时间进行弥补。Qwen训练流水线已适配在华为昇腾集群上运行,但软件工具链成熟度仍低于CUDA。 阿里云在国内市场与腾讯云、华为云和百度智能云直接竞争,包括GPU租用、模型API服务和企业LLM部署在内的AI云服务成为主要增长引擎。通义品牌将阿里巴巴AI产品统一于单一身份下,消费者端为通义千问聊天机器人,开发者端为通义API。淘宝、天猫、支付宝、饿了么、钉钉等广泛的消费者生态系统为AI功能提供了庞大的内部部署面,使阿里云在国内AI市场份额上拥有全球同行难以复制的优势。

关键路径 — 从原料硅到部署

存储器(HBM)

YMTC

Xtacking 3D NAND闪存(232层)

芯片设计

NVIDIA

H100、H200、Blackwell B200 GPU

电力与冷却

Vertiv

液冷、UPS、PDU系统

云服务商

Alibaba Cloud

阿里云AI、含光800 NPU、通义千问

AI消费者

DeepSeek

DeepSeek-V3、DeepSeek-R1(前沿推理模型)

影响Alibaba Cloud的出口管制