字数 2085,阅读大约需 11 分钟

Anthropic CEO 警示:随着 AI 愈发强大,理解 AI 刻不容缓
在巴黎人工智能行动峰会结束后,Anthropic的联合创始人兼首席执行官达里奥·阿莫迪(Dario Amodei)称此次峰会是一次“错失的机会”。他在周二发布的声明中补充道,“鉴于该技术的发展速度,在几个关键主题上需要更多的关注和紧迫感”。
Anthropic与法国初创公司Dust合作,在巴黎举办了一场以开发者为重点的活动。期间,阿莫迪阐述了他的思路,并就AI创新与治理问题提出了第三条道路,既非纯粹的乐观,也非纯粹的批判。
阿莫迪表示:“我曾经是一名神经科学家,以研究真实大脑为生。如今,我们以研究人工智能大脑为生。在接下来的几个月里,我们将在可解释性领域取得令人兴奋的进展,真正开始理解模型是如何运作的。但这绝对是一场竞赛,一场让模型变得更强大的竞赛。对我们和其他公司而言,进展都极其迅速,根本无法放慢脚步。我们对模型的理解必须跟上构建模型的能力,这是唯一的出路。”
自英国布莱奇利首次举办人工智能峰会以来,围绕AI治理的讨论基调发生了显著变化。这在一定程度上归因于当前的地缘政治格局。美国副总统JD·万斯(JD Vance)在周二的人工智能行动峰会上表示:“我今天上午来这里,不是要谈论几年前会议的主题——人工智能安全,而是要谈论人工智能带来的机遇。”
有趣的是,阿莫迪试图避免在安全与机遇之间制造对立。事实上,他认为对安全的更多关注本身就是一种机遇。阿莫迪在Anthropic的活动中提到:“在最初的布莱奇利峰会上,有很多关于各种风险测试和衡量的讨论。我认为这些讨论并没有过多地减缓技术发展,反而,这种衡量帮助我们更好地理解模型,最终有助于我们开发出更好的模型。”
每次强调安全时,阿莫迪也不忘提醒大家,Anthropic仍非常专注于构建前沿的AI模型。他说:“我不想做任何降低其潜力的事情。我们每天都在提供模型,人们可以在此基础上进行开发,做出惊人的成果。我们绝对不应停止这样做。当人们过多谈论风险时,我会有些恼火,心想:‘哎呀,没人真正把这项技术的潜力阐述清楚。’”
对中国大语言模型DeepSeek的看法
当话题转向中国大语言模型制造商DeepSeek最近发布的模型时,阿莫迪对其技术成就不以为然,称公众反应“不自然”。他说:“老实说,我的反应不大。我们在去年12月就看到了V3,它是DeepSeek R1的基础模型,那是一个令人印象深刻的模型。该模型遵循着我们在自身及其他模型中看到的正常成本降低曲线。”
值得注意的是,该模型并非来自美国的“三四个前沿实验室”。他列举了谷歌、OpenAI和Anthropic等通常在发布新模型方面引领前沿的实验室。阿莫迪表示:“这对我来说是一个地缘政治问题,我绝不想让专制政府主导这项技术。”
至于DeepSeek所谓的训练成本,他否认了训练DeepSeek V3比美国训练成本低100倍的说法,称“这既不准确,也没有事实依据”。
Anthropic即将推出的具有推理能力的模型
虽然阿莫迪在周三的活动中没有宣布任何新模型,但他透露了公司即将发布的一些成果,其中包括模型推理能力的提升。阿莫迪说:“我们一直致力于打造更具差异化的推理模型,关注模型的容量是否足够、是否变得更智能以及安全问题。”
Anthropic试图解决的问题之一是模型选择难题。例如,如果你有一个ChatGPT Plus账户,在为下一条消息选择模型时,很难知道在弹出的模型选择框中该选哪一个。对于使用大语言模型(LLM)API开发应用程序的开发者来说也是如此,他们需要在准确性、回答速度和成本之间找到平衡。
阿莫迪提到:“我们对存在普通模型和推理模型,且它们似乎相互不同的观点感到有些困惑。就像我和你交流时,你不会有两个大脑,一个马上回应,另一个则等待更长时间。”
据他所说,根据输入内容,在像Claude 3.5 Sonnet或GPT – 4o这样的预训练模型,与像OpenAI的o1或DeepSeek的R1这样通过强化学习训练并能产生思维链(CoT)的模型之间,应该有更平滑的过渡。阿莫迪表示:“我们认为这些模型应该作为一个连续统一体的一部分存在。或许我们还未实现,但Anthropic确实希望朝这个方向发展。从预训练模型到其他模型,应该有更平滑的过渡,而不是‘这是A模型,那是B模型’这样明显的区分。”
随着Anthropic等大型人工智能公司不断推出更出色的模型,阿莫迪相信这将为颠覆各个行业的大型企业带来巨大机遇。他举例称:“我们正在与一些制药公司合作,使用Claude撰写临床研究报告,他们将撰写报告的时间从12周缩短到了3天。在法律、金融、保险、生产力、软件、能源等领域,人工智能应用都将迎来颠覆性创新。我们希望助力并支持这一切。”
例如,某制药公司与Anthropic合作,利用AI技术优化药物研发流程,将研发周期大幅缩短。某金融公司借助AI算法分析市场数据,精准预测市场趋势,提升了公司销售额。这些案例都表明,随着AI技术的不断发展和完善,其在各个行业的应用将带来更多的创新和变革。
同时,对于AI安全与发展的平衡问题,众多权威机构也在持续关注。有报告指出,加强AI安全措施虽短期内可能增加成本,但长期来看能有效降低因AI风险带来的损失。而在AI可解释性方面,相关研究表明目前具备较高可解释性的AI模型占比较低,这也进一步凸显了阿莫迪所强调的在模型发展的同时提升理解能力的紧迫性。
在全球AI竞争格局中,美国、中国和欧洲作为AI创新的核心地区,各自有着独特的优势和发展方向。美国在基础研究和前沿技术方面具有领先地位,拥有众多顶尖的科研机构和科技巨头;中国则在应用场景拓展和数据积累方面表现突出,庞大的市场为AI技术的落地提供了丰富的土壤;欧洲在AI伦理和治理方面较为重视,致力于制定规范的行业标准。这种全球范围内的竞争与合作,加速了AI技术的发展和普及。