Mistral董事会成员:DeepSeek难缓AI的GPU需求

字数 1542,阅读大约需 8 分钟

Mistral董事会成员:DeepSeek难缓AI的GPU需求
Mistral是一家专注于人工智能技术研发的公司,以开源模式运营,致力于开发先进的AI模型,在AI模型研发方面具有较强竞争力,拥有较多计算资源。

Mistral董事会成员兼a16z风投Anjney Midha:DeepSeek无法缓解AI的GPU需求

Andreessen Horowitz的普通合伙人兼Mistral董事会成员Anjney “Anj” Midha透露,早在六个月前,他就注意到了DeepSeek令人惊叹的表现。当时,DeepSeek推出了Coder V2,根据其去年发布的一篇论文,在特定编程任务方面,该模型可与OpenAI的GPT4 – Turbo相媲美。此后,DeepSeek保持着每几个月就发布改进模型的节奏,直至推出新的开源推理模型R1。R1以极低的成本提供了行业标准的性能,在科技行业引起了轰动。

尽管英伟达股票有所抛售,但Midha认为,R1的出现并不意味着AI基础模型会停止斥巨资抢购GPU芯片并尽快建设更多数据中心。相反,各公司会在现有计算能力基础上,更高效地利用资源。Midha表示:“当人们问我,Mistral筹集了10亿美元,DeepSeek的出现是否意味着这笔钱毫无必要?答案是否定的。实际上,借鉴DeepSeek的效率提升经验,再投入资金,我们能从相同的计算资源中获得10倍的产出。”

他还指出,Mistral虽然在融资规模上远不及OpenAI和Anthropic,例如OpenAI据传正在洽谈再筹集400亿美元的巨额资金,但Mistral凭借开源模式仍具有竞争力。开源模式使得公司能够获得众多开源爱好者的免费技术支持,而闭源竞争对手则需要自行承担所有的人力成本和计算资源费用。Midha谈到其投资的公司时说:“你不需要200亿美元,只需要比其他任何开源模型应用拥有更多的计算资源。Mistral在这方面处于有利地位,它是所有开源供应商中计算资源最多的。”

Facebook的Llama作为西方最大的开源AI模型,与Mistral形成竞争。其首席执行官马克·扎克伯格周三表示,仍计划在AI领域投入“数千亿美元”,其中2025年的资本支出为600亿美元,主要用于数据中心建设。

Midha作为a16z的Oxygen GPU共享计划负责人,从另一角度阐述了AI对GPU需求不会减弱的原因。由于GPU,特别是英伟达最先进的H100芯片极为稀缺,大约一年半前,a16z决定自行购买一批GPU供其投资的公司使用。然而,Oxygen计划目前供不应求,Midha笑称:“我现在无法分配足够的GPU。”初创公司不仅在AI模型训练阶段需要GPU,在为客户运行AI产品时,对GPU的需求更是有增无减。他解释道:“现在对于推理和应用的需求是无穷无尽的。”因此,他认为DeepSeek的技术突破也不会改变OpenAI与软银、甲骨文本月早些时候宣布的5000亿美元的AI数据中心合作项目Stargate。

DeepSeek带来的重大影响是,各国意识到AI将成为像电力和互联网一样的基础基础设施。Midha提出 “基础设施独立” 的概念,他认为各国需要考虑,是依赖存在审查机制并可能涉及数据控制的中国模型,还是选择遵循西方法律和道德规范、遵守北约协议的西方模型,他显然倡导西方国家使用像位于巴黎的Mistral这样的西方模型。事实上,已有数百家公司出于这种担忧,对既是消费应用服务又是开源模型的DeepSeek进行了封锁。

不过,并非所有人都对中国开源模型心存恐惧。一些公司可以在自己的数据中心本地运行这些模型,而且像微软Azure Foundry这样的美国公司已经将DeepSeek作为安全云服务提供,开发者无需使用DeepSeek自己的云服务。例如,英特尔前首席执行官Pat Gelsinger就表示,他的初创公司Gloo正在基于DeepSeek R1的自有版本构建AI聊天服务,而非选择Llama或OpenAI。

Midha笑称:“如果你有多余的GPU,请送给我。”这一诙谐的表述,也侧面反映出当前AI领域对GPU需求的旺盛。

© 版权声明

相关文章

暂无评论

暂无评论...