OpenAI承诺的工具为何难产?AI版权纷争何解?

AI头条1个月前发布 freeAI
0
OpenAI承诺的工具为何难产?AI版权纷争何解?

OpenAI

OpenAI的承诺与逾期未兑现

早在去年5月,OpenAI就宣称正在开发一款名为Media Manager的工具(OpenAI官网),旨在让创作者能够指定自己的作品如何被纳入或排除在其AI训练数据之外。按照其设想,这个工具可以“识别受版权保护的文本、图像、音频以及视频”,以此反映创作者跨多个来源的偏好,并且希望借此抵挡外界对其的强烈批评,甚至为其屏蔽一些与知识产权相关的法律挑战。

然而,时间来到2025年1月,7个月过去了,这一工具却依旧未能问世,OpenAI也错过了自己设定的在“2025年”(这里可理解为截至2025年1月1日)推出该工具的期限。有熟悉情况的人士透露,在OpenAI内部,这个工具似乎从未被视作重要的发布项目。一位前OpenAI员工表示:“我觉得它并不是优先事项,说实话,我都不记得有人在做这个事儿了。”还有一位与该公司有工作协调的非员工也曾提到,过去虽和OpenAI讨论过这个工具,但近期毫无更新进展。而且,负责Media Manager的OpenAI法律团队成员Fred von Lohmann在去年10月也转变成了兼职顾问角色。OpenAI方面至今未对Media Manager的进展给出更新说明。

AI训练引发的IP问题

当下,像OpenAI开发的这类AI模型,是通过学习数据集中的模式来进行预测的。比如,模型可以根据观察知晓一个人咬汉堡时会留下咬痕,这使得它们在一定程度上能了解世界的运转方式。像ChatGPT能写出令人信服的邮件和文章,OpenAI的视频生成器Sora能创建相对逼真的视频片段。AI借助众多写作、影视等示例来生成新作品的能力,让其变得无比强大,但也存在问题,那就是它具有重复性。

很多模型都是基于无数网页、视频和图像进行训练的,当以特定方式进行提示时,它们生成的内容近乎是那些数据的复制品。尽管这些数据是“公开可用”的,但并非意味着能被这样使用。例如,Sora能生成带有TikTok标志以及热门游戏角色的视频片段,《纽约时报》也曾发现ChatGPT逐字引用其文章内容(OpenAI将此行为归咎于“黑客攻击”)。

这自然让众多创作者不满,毕竟他们的作品未经许可就被纳入AI训练了,于是许多创作者聘请了律师维权。OpenAI正面临着来自艺术家、作家、YouTubers、计算机科学家以及新闻机构等发起的集体诉讼,像作家Sarah Silverman、Ta Nehisi-Coates,视觉艺术家,还有诸如《纽约时报》、加拿大广播公司等媒体集团都是原告,他们都声称OpenAI非法使用他们的作品进行训练。虽然OpenAI也尝试与部分合作伙伴达成授权协议,但并非所有创作者都认可相关条款。

现有“退出”机制的不足与Media Manager的定位

目前,OpenAI为创作者提供了几种临时的“退出”其AI训练的方式。去年9月,该公司推出了一个提交表单,让艺术家可以标记自己的作品,以便从未来的训练集中移除。并且长期以来,OpenAI也允许网站管理员阻止其网络爬虫在自己的域名内抓取数据。

但创作者们对这些方法并不满意,认为它们太过随意且不够完善。比如对于书面作品、视频或者音频记录,并没有特定的退出机制,而针对图像的退出表单,需要提交每份要移除图像的副本以及描述,操作极为繁琐。

Media Manager原本被宣传为是对OpenAI现有退出解决方案的一次全面革新与扩展。OpenAI在当初的公告中称,Media Manager会运用“前沿的机器学习研究”,让创作者和内容所有者能够明确“自己所拥有的内容”,还声称在开发工具时与监管机构有合作,希望它能“为整个AI行业树立标准”,只是自那之后,OpenAI再也没有公开提及过Media Manager。其发言人曾在8月表示该工具“仍在开发中”,但对于12月中旬后续的置评请求却未作回应,也未说明该工具何时可能推出,以及会具备哪些功能特性。

Media Manager的潜在影响争议

即便Media Manager未来某时真的推出了,专家们也并不认为它能缓解创作者的担忧,或者在解决围绕AI和IP使用的法律问题上起到多大作用。

IP律师Adrian Cyhan指出,像YouTube、TikTok这样规模庞大的平台在大规模内容识别方面都存在困难,Media Manager所描述的功能是一项颇具野心的任务,OpenAI真的能做得更好吗?他提到,“确保符合法律要求的创作者保护以及潜在的补偿要求,面临着诸多挑战,特别是考虑到各国和各地区司法管辖区的法律环境在迅速变化且可能存在差异。”

非营利组织Fairly Trained的创始人Ed Newton-Rex认为,Media Manager会将控制AI训练的负担不公平地转移到创作者身上,因为创作者若不使用它,可能就会被视作默许自己的作品被使用。“大多数创作者甚至都不会听说这个工具,更别说使用了,可它却会被用来为违背创作者意愿的大规模利用创作作品的行为做辩护。”

MBHB的AI实践小组联合主席Mike Borella则指出,退出系统并不总能考虑到对作品可能进行的转换情况,比如被降采样的图像。Pryor Cashman的IP和媒体律师Joshua Weigensberg补充说,这类系统也可能无法解决第三方平台托管创作者内容副本这种常见情况,毕竟“创作者和版权所有者无法控制,甚至常常都不知道自己的作品在互联网上出现在哪里,即便创作者告知了每一个AI平台自己要退出训练,这些公司仍有可能继续使用第三方网站和服务上的作品副本进行训练。”

此外,Dorsey & Whitney的版权法专家Evan Everist表示,即便OpenAI能利用Media Manager向法官表明其在减少对受知识产权保护内容的训练,但如果被认定侵权,该工具可能也无法让公司免受损害,因为“版权所有者没有义务在侵权发生前主动告知他人不要侵犯自己的作品,版权法的基本准则依然适用,即未经许可,不得拿走和复制他人的东西,所以这个功能可能更多是关乎公关,旨在将OpenAI定位成一个有道德的内容使用者。”

OpenAI当前的应对与版权纷争前景

在Media Manager缺席的情况下,OpenAI已经实施了一些过滤措施(尽管并不完美),来防止其模型重复输出训练示例内容。在应对诸多诉讼时,该公司也继续声称享有合理使用保护,坚称其模型生成的是具有创新性、而非抄袭性的作品。

OpenAI有可能在版权纠纷中胜诉,法院也许会参照大约十年前出版业起诉谷歌一案所确立的先例,判定该公司的AI具有‘创新性目的’。在那起案件中,法院认为谷歌为谷歌图书(一种数字档案)复制数百万册书籍的行为是被允许的。OpenAI也曾公开表示,如果不使用受版权保护的材料(无论是否获得授权),就不可能训练出有竞争力的AI模型,其在提交给英国上议院的一份文件中提到,“将训练数据限制在一个多世纪前创作的公共领域书籍和绘画上,可能会产生一个有趣的实验,但无法提供满足当今公民需求的AI系统。”若法院最终判定OpenAI胜诉,那么Media Manager在法律层面也就没多大意义了,而OpenAI似乎也愿意下这个赌注,或者重新考虑其退出策略。

© 版权声明

相关文章

暂无评论

暂无评论...