去年,备受关注的 OpenAI 隆重举办了一场发布会,推出了众多创新性产品及工具,然而颇具戏剧性的是,他们还推出了备受争议的类似 App Store 的 GPT Store。
相较而言,今年的 DevDay 显得低调许多。OpenAI 宣布,为了更好地满足开发者需求,他们决定调整 DevDay 的形式,由大规模活动变为一连串的开发者见面会。同时,该公司也明确指出,今年不会发布下一代主要旗舰产品,而将重点放在升级 API 和开发者服务上。
![OpenAI 今年秋季的 DevDay将不会有 GPT-5 的出现](https://aimgsgoheap.codexiu.cn/2024/08/image-2024-08-06-openai-web.webp)
OpenAI 的发言人:“我们并不打算在 DevDay 上公布新的模型。我们希望能更深入地向开发者介绍现有资源,分享开发社区的故事。”
据悉,OpenAI 今年的 DevDay 活动将分别于 10 月 1 日在旧金山、10 月 30 日在伦敦和 11 月 1 日在新加坡举行。活动内容丰富多样,包括研讨会、分组讨论、OpenAI 产品和工程师的演示以及开发者焦点等环节。参会费用为 450 美元(或可参加免费奖学金项目),报名截至日期为 8 月 15 日。
近几年来,OpenAI 在生成式人工智能领域的进步相对平稳,并未出现惊世骇俗的突破。相反,其逐渐注重提升现有模型如 GPT-4o 和 GPT-4o mini 的性能,并设法避免模型出轨现象的发生。尽管如此,OpenAI 似乎尚未恢复在生成式人工智能竞赛中的技术领导地位。
对此,部分原因或许在于获取高质量训练数据变得愈发困难。就像大多数生成式 AI 模型一样,OpenAI 需要依赖海量在线数据进行训练,而很多创作者却因担忧数据泄露、无法获得相应回报等因素,选择屏蔽这些网络数据。数据显示,目前全球排名前 1,000 的网站中有超过 35% 的站点封锁了 OpenAI 的网络爬虫;一项来自麻省理工学院的研究亦揭示,大约四分之一的“优质”数据源数据,已被禁止用于训练 AI 模型。更为严峻的是,如果上述数据访问阻塞的态势持续发展,那么到 2026 年至 2032 年之间,开发人员可能会消耗殆尽用于训练生成式 AI 模型的数据。
因此,为了应对这个挑战,OpenAI 不得不与各大出版社和数据代理商签署昂贵的许可协议。此外,OpenAI 还研发了一种新型推理技术,以期改善模型对特定问题(特别是数学问题)的解答能力。值得一提的是,该公司的首席技术官 Mira Murati 曾公开承诺,未来的模型将会拥有“博士级”的智慧。(OpenAI 在 5 月份的一篇博客文章中透露,他们已经开始着手训练下一个“前沿”模型。)
然而,OpenAI 仍然面临着诸多争议,如利用受版权保护的数据进行训练、限制员工保密协议以及有效地排挤安全研究人员等问题。此次产品周期放缓或许能带来一些积极影响,比如反驳那些认为 OpenAI 为了追求更强大、更先进的生成式 AI 技术而忽视 AI 安全工作的观点。