DeepSeek

Hangzhou DeepSeek Artificial Intelligence Basic Technology Research Co., Ltd.

🇨🇳
AI消費者🇨🇳 CN非上市
deepseek.com

核心產品

DeepSeek-V3、DeepSeek-R1(前沿推理模型)

追蹤供應鏈 →
詳細簡報▼ 展開

DeepSeek於2023年作為杭州量化對沖基金幻方科技的AI研究子公司成立。幻方在出口管制收緊之前積累了中國最大的GPU叢集之一。由幻方CEO梁文鋒領導的創始團隊將量化金融中的數值優化專業知識直接應用於AI訓練效率,這被證明是決定性的競爭優勢。 2024年12月發布的DeepSeek-V3和2025年1月發布的DeepSeek-R1,構成了自GPT-4以來對美國AI實驗室最重大的競爭性衝擊。DeepSeek聲稱V3的訓練成本約為560萬美元的GPU小時數——這一數字在細節上受到質疑,但仍指向了與美國同類前沿模型估計數億美元相比的根本性效率差距。R1模型以獨特方式將人類反饋強化學習與思維鏈推理相結合,產生了可與OpenAI o1競爭的基準結果,引發了英偉達股票的大幅拋售(即2025年1月27日的「DeepSeek時刻」),市場重新評估了前沿AI算力需求的假設。 DeepSeek的效率技術在技術層面具有實質意義。V3架構使用多頭潛在注意力(MLA),通過低秩投影矩陣壓縮KV快取,大幅降低推理時的記憶體頻寬壓力。還採用256個專家中每token僅啟動8個的MoE路由方案,以及FP8混合精度訓練——這是當時在NVIDIA H800 GPU(H100的出口管制合規版本,NVLink互連頻寬降低)上減少記憶體佔用、提升吞吐量的創新方法。據報道,DeepSeek的訓練在約2048塊H800 GPU的叢集上進行。 出口管制是DeepSeek硬體路線圖的決定性約束。BIS 2023年10月規則將H100/H200 GPU列為向中國出口需要許可證的受控商品,後續2024/2025年規則進一步收緊。DeepSeek使用H800(購買時合規)的情況正受到審查,涉及這些晶片是否通過合法渠道獲取。由於H800現已受控,DeepSeek正將未來訓練轉向華為昇騰910B和910C NPU,儘管與英偉達產品相比,其軟體成熟度和互連頻寬較低。 DeepSeek成果的地緣政治影響重塑了AI晶片出口管制辯論。那些認為限制先進GPU出口能維持持久性能差距的美國政策制定者,如今面臨效率驅動方法可在一定程度上彌補硬體劣勢的證據。與此同時,DeepSeek以寬鬆許可證開放發布模型權重,使其技術在全球範圍內可獲取,加速了MLA和MoE路由等架構創新向全球開源和專有模型開發的擴散。

關鍵路徑 — 從原料矽到部署

雲端服務商

Huawei Cloud

華為雲EI(AI)、基於昇騰910的ModelArts平台

雲端服務商

Alibaba Cloud

阿里雲AI、含光800 NPU、通義千問

雲端服務商

Tencent Cloud

騰訊雲AI、混元大模型、GPU HPC叢集

AI消費者

DeepSeek

DeepSeek-V3、DeepSeek-R1(前沿推理模型)

影響DeepSeek的出口管制