OpenAI意外删除《纽约时报》版权诉讼的关键证据,案件复杂性再升级

AI头条2个月前更新 freeAI
0
OpenAI意外删除《纽约时报》版权诉讼的关键证据,案件复杂性再升级

纽约时报

近日,《纽约时报》和《每日新闻》对OpenAI提起的版权诉讼再次引发广泛关注。这两家媒体指控OpenAI未经许可,使用他们的作品来训练其AI模型。然而,案件的复杂性在近期因一次意外事件而进一步加剧——OpenAI工程师意外删除了可能与案件相关的数据。

今年早些时候,OpenAI同意提供两台虚拟机,以便《纽约时报》和《每日新闻》的律师能够搜索其AI训练数据集中的侵权内容。这些虚拟机主要用于测试、备份数据和运行应用程序。自11月1日起,律师及其聘请的专家已经花费了超过150小时的时间搜索OpenAI的训练数据。然而,在11月14日,OpenAI的工程师意外地删除了存储在其中一台虚拟机上的所有搜索数据。

尽管OpenAI尝试恢复数据并取得了部分成功,但由于文件夹结构和文件名“不可挽回地丢失”,已恢复的数据无法用于确定《纽约时报》和《每日新闻》的文章是否被用于构建OpenAI的模型。律师们表示,他们不得不从头开始重新进行工作,这不仅耗费了大量时间和资源,还导致整个调查过程受到严重干扰。

OpenAI的一位发言人拒绝就此事发表评论。但在11月22日晚,OpenAI的律师提交了一份回应,否认了删除任何证据的说法,并将责任归咎于原告方请求的一项系统配置更改,称该更改导致了一个临时缓存硬盘上的文件夹结构和部分文件名丢失。OpenAI认为,没有理由相信有任何文件实际丢失。

OpenAI一直坚持认为,使用公开可用的数据训练模型属于合理使用。例如,在创建其最新的模型如GPT-4o时,OpenAI声称无需获得许可或支付费用,即使这些模型最终产生了商业利益。然而,OpenAI也与越来越多的新闻出版商签署了许可协议,包括美联社、Axel Springer、《金融时报》、People杂志的母公司Dotdash Meredith以及News Corp等。尽管OpenAI未公开这些协议的具体条款,但有报道称,Dotdash每年至少获得了1600万美元的许可费。

OpenAI既未确认也未否认其AI系统是否在未经许可的情况下使用了任何特定的版权作品。此次数据删除事件无疑增加了案件的复杂性,也引发了公众对OpenAI数据管理和透明度的质疑。

© 版权声明

相关文章

暂无评论

暂无评论...