Mistral AI

Mistral AI SAS

🇫🇷
AI消费者🇫🇷 FR非上市
mistral.ai

核心产品

Mistral Large、Mixtral 8×22B、Codestral(开放权重大模型)

追踪供应链 →
详细简报▼ 展开

Mistral AI由Arthur Mensch、Guillaume Lample和Timothée Lacroix(DeepMind和Meta FAIR的校友)于2023年4月创立,迅速成为美国以外最具影响力的AI实验室之一。公司的核心战略选择是以开放权重下载形式发布早期模型:2023年9月发布的Mistral 7B在大多数基准测试中达到或超越LLaMA 2 13B的性能,同时体积更小、运行更快,确立了Mistral在参数效率方面的声誉。 2023年12月发布的Mixtral 8x7B将稀疏混合专家(MoE)架构引入开放权重模型领域。通过每个token仅激活八个专家子网络中的两个,Mixtral以极低的推理计算成本实现了GPT-3.5级别的性能——这一重要技术里程碑影响了整个行业后续模型的设计。2024年4月发布的Mixtral 8x22B将此MoE方法扩展到更大的参数规模。 微软于2024年6月对Mistral进行战略投资,估值约60亿欧元,并将Mistral模型集成到Azure AI Studio。该合作使Mistral能够访问微软的全球Azure H100 GPU集群基础设施,用于训练和推理服务。Mistral还获得了a16z、英伟达和Salesforce Ventures的融资,总融资额超过10亿美元。 欧盟主权维度是Mistral定位的核心。欧洲政策制定者频繁将该公司列为证明竞争性前沿AI开发可在欧盟监管框架内实现的典范。开放授权方式与欧盟对技术透明度的偏好一致。公司参与了法国政府将巴黎打造为AI中心的举措,其模型被寻求美国本土AI供应商替代方案的欧洲企业广泛使用。 在计算依赖方面,Mistral的训练运行在通过云合作伙伴获取的大型NVIDIA H100集群上执行。随着公司向更大的模型系列和商业API服务(La Plateforme)扩展,对GPU容量的需求也相应增长——尽管具有欧洲身份,但仍与其他前沿实验室处于相同的H100/H200采购管道中。限制H100向特定地区出口的出口管制法规不直接影响Mistral的运营,但塑造了其所处的竞争格局。

关键路径 — 从原料硅到部署

云服务商

Microsoft Azure

Azure AI HPC集群、Maia 100定制AI ASIC

AI消费者

Mistral AI

Mistral Large、Mixtral 8×22B、Codestral(开放权重大模型)