Alibaba Cloud
Alibaba Cloud Intelligence Group
主要製品
Alibaba Cloud AI、Hanguang 800 NPU、Qwen LLM
ボトルネック状況
🔴 2023年10月BIS規制以降NVIDIA H100/H200から切断
詳細情報▼ 展開
アリバババクラウド(阿里雲)は、アリバババグループ(NYSE/HKEX: BABA)のクラウドコンピューティング子会社であり、中国最大かつ収益規模でAWS・Azureに次ぐ世界第3位のクラウドプロバイダーである。2009年に創設され、2024年度の年間売上は約150億ドルに達し、AI主導ワークロードのシェアが増加している。クラウド部門は中国本土・香港・シンガポール・日本・ドイツ・オーストラリア・米国にわたるデータセンターネットワークを運営し、アジアのクラウドプロバイダーの中で最もグローバルに分散したフットプリントのひとつを持つ。 アリバババのAIチップ戦略は3つのハードウェア層にわたる。第一に、2019年に発表されたHanguang 800 NPUはTSMCの12nmプロセスで製造され、アリバババのDAMO Academyがeコマースレコメンデーション・画像検索・自然言語推論ワークロード向けに設計した。Hanguang 800はTaobaoとアリバババの広告システムを支え、毎日数兆件の推論クエリを処理する。これは汎用トレーニングチップではなく高度に特化した推論アクセラレータであり、アリバババのコアワークロードに対する外部GPUへの依存を低減する差別化アプローチだ。第二に、アリバババクラウドは大規模AIトレーニング向けにNVIDIA A100とH800クラスターを運営していたが、2023年10月のBIS輸出管理拡大に続き、H100/H200の輸出を受けられなくなり、NVIDIAの中国準拠H20 GPUに移行した。第三に、アリバババクラウドはH20より高い相互接続帯域幅が必要なワークロードの国内代替としてHuawei Ascend 910Bクラスターを契約している。 アリバババの通義千問(Qwen)LLMファミリーは2023年に開始され、中国で最も広く展開されているモデルシリーズのひとつとなっている。Qwenモデルは0.5Bから72Bパラメータのサイズにわたり、マルチモーダルバリアント(Qwen-VL)とコード特化バージョン(Qwen-Coder)も含む。2024年6月にリリースされたQwen2シリーズは、LLaMA 3やMistralを含む国際的なオープンウェイトモデルと比較して競争力あるベンチマーク結果を示した。アリバババはほとんどのQwenバリアントを許容的なライセンスでオープンソース化し、2025年初頭時点でダウンロード数においてHugging Face上で最も人気の中国語オープンウェイトモデルシリーズとなっている。 輸出規制がアリバババクラウドに与える影響は多次元的だ。H20 GPU——NVIDIAの格下げ中国準拠製品——はH100/H200と比べてNVLink帯域幅とGPU間相互接続性能が大幅に低く、大規模トレーニングの効率を下げる。アリバババの対応は、モデル効率化技術・相互接続帯域幅削減に最適化された分散トレーニングフレームワーク・期間で補う長いトレーニングランへの投資強化だ。QwenトレーニングパイプラインはHuawei Ascendクラスターで動作するように適応されているが、ソフトウェアツールチェーンの成熟度はCUDAより依然低い。 アリバババクラウドは中国市場でテンセントクラウド・Huaweiクラウド・バイドゥAIクラウドと直接競合しており、GPU賃貸・モデルAPIサービス・企業向けLLM展開を含むAIクラウドサービスが主要な成長ベクターとなっている。通義(Tongyi)ブランドはアリバババのAI製品を単一のアイデンティティに統合し、消費者向けチャットボットとして通義千問、開発者向けにQwenモデルへのアクセスを提供する通義APIを提供している。淘宝・天猫・支付宝・餓了么・DingTalkなどアリバババの広大な消費者エコシステムが、AIフィーチャーの大規模な囲い込み展開面を提供し、グローバルのクラウドピアが容易に模倣できない国内AIマーケットシェアでの優位性をもたらしている。
クリティカルパス — 原料シリコンから配備まで
メモリ(HBM)
YMTC
Xtacking 3D NANDフラッシュ(232層)
チップ設計
NVIDIA ▲
H100、H200、Blackwell B200 GPU
電力・冷却
Vertiv ▲
液冷・UPS・PDUシステム
クラウドプロバイダー
Alibaba Cloud
Alibaba Cloud AI、Hanguang 800 NPU、Qwen LLM
AI消費者
DeepSeek
DeepSeek-V3、DeepSeek-R1(フロンティア推論モデル)