Grok3:思维链与多模态的革新突破

AI快讯2个月前发布 freeAI
0

字数 949,阅读大约需 5 分钟

Grok3:思维链与多模态的革新突破
xAI致力于开发人工智能相关技术,推出了Grok系列模型,如Grok1、Grok2、Grok3,在模型训练、推理能力等方面进行探索与创新

Grok3 技术亮点:思维链与多模态能力的突破

Grok3 的模型训练基于合成数据,这让它能通过反复审视数据实现逻辑一致性,还能对自身错误反思与纠正。其最大亮点是引入“思维链”(Chain Of Thought)推理能力。具备该能力的模型,可像人类一样把复杂任务拆解为逐步推进的步骤,大幅提升对复杂查询的处理能力。面对复杂问题,传统人工智能模型可能给出片面或逻辑跳跃的回答,Grok3 凭借“思维链”,能提供更连贯且逻辑性强的响应。

不仅如此,Grok3 在推理、编程能力以及文本和图像分析等多模态功能方面也有显著提升。以编程能力为例,知名编程社区调研显示,目前市场上大部分人工智能处理复杂编程逻辑的成功率约 60%,而 Grok3 团队称,通过优化算法和大量针对性训练,Grok3 在复杂编程任务上的成功率能突破 80%。在文本和图像分析的多模态领域,随着人工智能在内容创作、信息检索等方面应用日益广泛,多模态能力的提升将使 Grok3 在市场竞争中占据更有利位置。

Grok 系列的进化之路

自 2023 年 11 月 Grok1 问世,Grok 系列就开启了进化之旅。Grok1 主要依赖合成数据训练,面对真实世界的复杂性表现欠佳。比如在处理涉及现实场景的常识性问题时,Grok1 的准确率仅 40%,远低于行业平均水平。随后推出的 Grok2 在此基础上改进,融入少量高质量真实数据,在真实场景中的表现有所提升,准确率提高到 60%。然而,与行业内主要竞争对手相比,xAI 在大模型竞争中的进展相对较慢。

在 Grok3 推出前夕,OpenAI 宣布其 GPT – 4o 模型智力水平提升至 o3pro 级别,该模型一经推出便成为目前最佳的 AI 搜索产品。第三方权威机构对全球主流人工智能模型的评估报告显示,GPT – 4o 在综合性能方面得分高达 85 分(满分 100 分),而 Grok2 的得分仅 70 分。这一差距凸显了 xAI 在追赶行业领先者时面临的挑战。

Grok3 发布背后的产业博弈与资本角逐

Grok3 的发布时间比马斯克早前预期有所延迟。去年夏天,马斯克在社交平台透露 Grok3 将在 2024 年底推出,且预计用 100,000 张 H100GPU 进行训练。此外,xAI 正在与戴尔洽谈购买新一代 GB200GPU 服务器,这笔交易价值预计超 50 亿美元。为支撑这一战略布局,马斯克正积极为 xAI 进行约 100 亿美元的融资,xAI 的估值预计达 750 亿美元。不过,与 OpenAI 高达 1500 亿美元的估值相比,xAI 仍有较大差距。

值得一提的是,马斯克与 OpenAI 纠葛不断。最近,马斯克领导的财团以 974 亿美元的价格提出收购 OpenAI 的提案,但遭 OpenAI 拒绝。马斯克对 OpenAI 的营利性转变表示不满,甚至向法院申请阻止其转型为营利性机构。这场纷争既反映了马斯克与 OpenAI 之间的紧张关系,也从侧面展现了当前 AI 领域的激烈竞争态势。

© 版权声明

相关文章

暂无评论

暂无评论...