Mistral董事会成员：DeepSeek难缓AI的GPU需求

字数 1542，阅读大约需 8 分钟

Mistral董事会成员兼a16z风投Anjney Midha：DeepSeek无法缓解AI的GPU需求

Andreessen Horowitz的普通合伙人兼Mistral董事会成员Anjney “Anj” Midha透露，早在六个月前，他就注意到了DeepSeek令人惊叹的表现。当时，DeepSeek推出了Coder V2，根据其去年发布的一篇论文，在特定编程任务方面，该模型可与OpenAI的GPT4 – Turbo相媲美。此后，DeepSeek保持着每几个月就发布改进模型的节奏，直至推出新的开源推理模型R1。R1以极低的成本提供了行业标准的性能，在科技行业引起了轰动。

尽管英伟达股票有所抛售，但Midha认为，R1的出现并不意味着AI基础模型会停止斥巨资抢购GPU芯片并尽快建设更多数据中心。相反，各公司会在现有计算能力基础上，更高效地利用资源。Midha表示：“当人们问我，Mistral筹集了10亿美元，DeepSeek的出现是否意味着这笔钱毫无必要？答案是否定的。实际上，借鉴DeepSeek的效率提升经验，再投入资金，我们能从相同的计算资源中获得10倍的产出。”

他还指出，Mistral虽然在融资规模上远不及OpenAI和Anthropic，例如OpenAI据传正在洽谈再筹集400亿美元的巨额资金，但Mistral凭借开源模式仍具有竞争力。开源模式使得公司能够获得众多开源爱好者的免费技术支持，而闭源竞争对手则需要自行承担所有的人力成本和计算资源费用。Midha谈到其投资的公司时说：“你不需要200亿美元，只需要比其他任何开源模型应用拥有更多的计算资源。Mistral在这方面处于有利地位，它是所有开源供应商中计算资源最多的。”

Facebook的Llama作为西方最大的开源AI模型，与Mistral形成竞争。其首席执行官马克·扎克伯格周三表示，仍计划在AI领域投入“数千亿美元”，其中2025年的资本支出为600亿美元，主要用于数据中心建设。

Midha作为a16z的Oxygen GPU共享计划负责人，从另一角度阐述了AI对GPU需求不会减弱的原因。由于GPU，特别是英伟达最先进的H100芯片极为稀缺，大约一年半前，a16z决定自行购买一批GPU供其投资的公司使用。然而，Oxygen计划目前供不应求，Midha笑称：“我现在无法分配足够的GPU。”初创公司不仅在AI模型训练阶段需要GPU，在为客户运行AI产品时，对GPU的需求更是有增无减。他解释道：“现在对于推理和应用的需求是无穷无尽的。”因此，他认为DeepSeek的技术突破也不会改变OpenAI与软银、甲骨文本月早些时候宣布的5000亿美元的AI数据中心合作项目Stargate。

DeepSeek带来的重大影响是，各国意识到AI将成为像电力和互联网一样的基础基础设施。Midha提出 “基础设施独立” 的概念，他认为各国需要考虑，是依赖存在审查机制并可能涉及数据控制的中国模型，还是选择遵循西方法律和道德规范、遵守北约协议的西方模型，他显然倡导西方国家使用像位于巴黎的Mistral这样的西方模型。事实上，已有数百家公司出于这种担忧，对既是消费应用服务又是开源模型的DeepSeek进行了封锁。

不过，并非所有人都对中国开源模型心存恐惧。一些公司可以在自己的数据中心本地运行这些模型，而且像微软Azure Foundry这样的美国公司已经将DeepSeek作为安全云服务提供，开发者无需使用DeepSeek自己的云服务。例如，英特尔前首席执行官Pat Gelsinger就表示，他的初创公司Gloo正在基于DeepSeek R1的自有版本构建AI聊天服务，而非选择Llama或OpenAI。

Midha笑称：“如果你有多余的GPU，请送给我。”这一诙谐的表述，也侧面反映出当前AI领域对GPU需求的旺盛。

# AI快讯 # DeepSeek

文章版权归作者所有，未经允许请勿转载。

暂无评论

暂无评论...

Mistral董事会成员：DeepSeek难缓AI的GPU需求

Mistral董事会成员兼a16z风投Anjney Midha：DeepSeek无法缓解AI的GPU需求

OpenAI开源策略引争议，AI竞赛格局生变

全球最大语音数据集发布，机遇与风险并存

相关文章

暂无评论