最近,一则有趣的科技新闻在人工智能领域引起了不少关注。一名软件工程师以 “不到一顿Chipotle餐的价格”,成功购得OGOpenAI.com域名,并将其重定向至中国人工智能实验室DeepSeek的网站。这一独特举动背后,蕴含着开源AI发展的新动态与技术创新的探索。 据软件工程师阿纳奈・阿罗拉(Ananay Arora)向《TechCrunch》透露,他做出这一决策的初衷是为了支持DeepSeek。DeepSeek近期推出的名为DeepSeek – R1的开放版本模型,在开源AI领域可谓是崭露头角。 从技术层面来看,DeepSeek – R1模型有着显著亮点。它在多个标准测试中表现出色,如在美国AIME2024测试中,DeepSeek – R1以79.8分超越了OpenAI o1版本的79.2分;在MATH – 500测试里,DeepSeek – R1获得97.3分,领先于o1的96.4分;在SWE – bench Verified测试中,DeepSeek – R1得分为49.2,高于o1的48.9分。尽管在Codeforces代码测试中,DeepSeek – R1仅比o1低0.3分,但整体性能与o1模型相当。不仅如此,该模型在训练成本上也极具优势,相比同类模型成本降低了90% 。 值得一提的是,DeepSeek – R1在技术实现上,后训练阶段大规模使用强化学习技术,借助极少的标注数据便显著提升了模型的推理能力。这种技术路线不仅展现了DeepSeek团队在技术研发上的实力,也为其他开发者提供了新的思路。 从行业背景来看,OpenAI在近期逐渐减少开放高端模型的发布,这种保守做法受到了一些行业人士的批评。甚至在埃隆・马斯克的诉讼中也提到,指控该公司未能履行最初的非营利使命。而DeepSeek则反其道而行之,其模型可以离线使用,任何具备必要硬件的开发者都可以免费获取,这与OpenAI早期的一些模型,如Point – E和Jukebox类似,为开发者提供了更为便利的使用途径。 阿罗拉表示,他受到Perplexity首席执行官阿拉文德・斯里尼瓦斯(Aravind Srinivas)在X平台上发布的已删除帖子启发,帖子中将DeepSeek与早期的OpenAI进行了比较。他认为,把OGOpenAI.com这个域名重定向到DeepSeek会很有趣。这一举动不仅是对开源AI运动的一种支持,更是对技术变革和创新精神的一次有趣探索。 随着DeepSeek的崛起,中国的AI实验室正在逐渐释放出开放的替代模型,如阿里巴巴的Qwen等。这些都表明,在全球人工智能领域的竞争日益激烈的当下,开源AI正展现出强大的活力与潜力,为全球AI技术的发展注入新的动力。程序员购买OGOpenAI.com域名转向DeepSeek