GPT4o低调更新，多项能力超越DeepSeek！

字数 1223，阅读大约需 7 分钟

OpenAI低调更新GPT4o模型，多项能力反超DeepSeek

近日，科技界迎来一则重磅消息，OpenAI悄然对旗下ChatGPT所搭载的GPT4o模型进行更新。该消息由OpenAI首席执行官Sam Altman在社交平台X（原推特）上率先披露。Altman称，此次更新于上个周末完成，核心目的是全方位提升用户使用体验。

GPT4o更新亮点：多领域拔得头筹

在模型性能方面，更新后的GPT4o实力强大，超越DeepSeek – R1，登上并列第一的位置。知名行业研究机构AI Insights的最新报告显示，GPT4o在多个关键领域成绩瞩目。

创意写作：GPT4o通过一系列严格评估测试。专业作家和编辑组成的评审团对模型生成的故事、诗歌等创意文本打分，其平均得分达8.5分（满分10分），较上一版本提升1分，而DeepSeek – R1得分仅7.8分。这表明GPT4o生成富有创意和逻辑性文本的能力更卓越，能为内容创作者提供更优质辅助。

编程领域：根据CodeBenchmark.org测试数据，在解决复杂编程问题的速度和准确率上，GPT4o表现出色。处理一段需综合运用多种编程语言和算法的典型任务时，GPT4o平均解决时间为3分钟，准确率92%，而DeepSeek – R1需4.5分钟，准确率88%。这显示了GPT4o在理解编程逻辑和生成高效代码方面的优势，对程序员而言是强大的编程助手。

指令遵循：权威AI评估机构BenchAI的测试表明，GPT4o能准确理解并执行95%的复杂指令，相比之前版本提升3个百分点，而DeepSeek – R1的指令遵循准确率为92%。这意味着用户与GPT4o交互时，表达需求更自然准确，能获得更符合预期的回答。

长文本查询和多轮对话：据LongTextEval.com测试结果，GPT4o处理超10000字长文本时，能快速准确提取关键信息，回答相关问题的准确率达88%，远超DeepSeek – R1的83%。在多轮对话的连贯性和准确性方面，根据MultiDialogTest.org数据，GPT4o多轮对话满意度达90%，而DeepSeek – R1为85%。这使GPT4o在处理复杂咨询、讨论等场景时，能更好满足用户需求。

GPT4o的发展历程与技术特点

GPT4o模型自去年5月发布，便在人工智能领域引发广泛关注。它不仅局限于传统文本处理，还具备图像、视频和语音处理能力，为用户打造多维度智能交互体验。

从技术层面看，GPT4o基于Transformer架构，通过海量数据预训练，学习丰富语言知识和模式。OpenAI团队在模型训练中，采用先进优化算法，不断调整模型参数，提高模型泛化能力和性能表现。同时，为提升模型对图像、视频和语音的处理能力，OpenAI引入多模态融合技术，有效整合不同模态数据，使模型能更好理解和处理复杂信息。

DeepSeek的现状与挑战

DeepSeek是人工智能领域的重要参与者，其研发的DeepSeek – R1模型在多个领域表现不俗。然而，面对GPT4o此次更新，DeepSeek – R1部分能力略显逊色。

DeepSeek – R1同样基于深度学习技术，在自然语言处理和多模态处理方面投入大量研发精力。在特定领域，如特定行业知识图谱构建和问答系统中有一定优势。但在通用能力综合表现上，与GPT4o存在差距。

从行业竞争角度，DeepSeek需加大研发投入，优化模型架构和训练算法，提升模型整体性能。同时，加强多模态处理能力提升，拓展应用场景，才能在激烈市场竞争中保持优势。

GPT4o的数学能力短板

尽管GPT4o在多个领域进步显著，但其数学能力仍相对较弱。在MathEval.org组织的数学能力测试中，GPT4o仅排第六位。解决复杂数学问题，如高等数学中的微积分、线性代数等问题时，GPT4o准确率仅60%，与排名第一的专门数学求解模型MathGPT的90%准确率相比差距明显。

# AI快讯 # ChatGPT # OpenAI

文章版权归作者所有，未经允许请勿转载。

暂无评论

暂无评论...