字数 919,阅读大约需 5 分钟

中国AI公司DeepSeek发布推理模型R1,引发行业广泛关注。本周初,中国人工智能公司DeepSeek推出了其推理模型R1的开放版本,这一举动在科技行业激起千层浪,众多业内人士纷纷发表对该公司成果及对AI行业影响的看法。
风险投资家马克·安德森(Marc Andreessen)就曾发文称,DeepSeek所取得的成果是“他见过的最惊人、最令人印象深刻的突破之一”。据悉,R1模型在某些AI基准测试中,似乎能够与OpenAI的o1模型相媲美,甚至超越。更为引人注目的是,DeepSeek宣称其训练其中一个模型仅花费560万美元,相比之下,美国领先公司训练模型往往要投入数亿美元。
值得一提的是,DeepSeek是在面临美国制裁,禁止向中国公司出售先进芯片的情况下取得这一成果的。《麻省理工科技评论》指出,该公司的成功体现了制裁正“促使像DeepSeek这样的初创公司以注重效率、资源整合和协作的方式进行创新”。不过,《华尔街日报》也报道称,DeepSeek的梁文峰近期向中国总理表示,美国的出口限制仍构成瓶颈。
在这场讨论中,各方观点不一。Curai首席执行官尼尔·科斯拉(Neal Khosla)竟无端声称该公司是“中共的国家心理战”,称其“伪造低成本以证明低价合理,希望大家转而使用它,从而损害美国的AI竞争力”。但他的这一言论毫无证据,其帖子还被附上社区说明指出这一点,并且其父亲维诺德(Vinod)还是OpenAI的投资者。与此同时,记者霍尔格·茨沙皮茨(Holger Zschaepitz)则提出,DeepSeek“可能对美国股票市场构成最大威胁”。理由是若一家中国公司能在无法获取先进芯片的情况下,以低成本打造尖端模型,那么美国在该行业投入的数千亿美元资本支出的效用将受到质疑。
而Y Combinator首席执行官加里·谭(Garry Tan)则认为,DeepSeek的成功实际上对美国竞争对手有益。他在X平台(原推特)上写道:“如果训练模型变得更便宜、更快、更容易,那么对推理(AI在现实世界的实际应用)的需求将增长得更快,从而确保计算资源得到利用。”Meta首席AI科学家杨立昆(Yann LeCun)则反对从中国与美国对抗的角度看待DeepSeek的成果。他指出,真正的启示是“开源模型正在超越专有模型”。他在领英(LinkedIn)上写道:“DeepSeek从开源研究和开源项目(如Meta的PyTorch和Llama)中获益。他们提出新想法,并在他人工作的基础上进行构建。由于他们的工作是公开和开源的,每个人都能从中受益。”
这场激烈的讨论似乎极大地推动了消费者对DeepSeek产品的兴趣。截至周日下午,DeepSeek的AI助手已成为苹果App Store上排名第一的免费应用程序,领先于ChatGPT。这一现象充分显示了DeepSeek在AI领域引发的热度以及其产品的受关注程度。