谷歌发布AI生成文本水印技术SynthID Text,助力开发者识别AI内容

AI头条3个月前更新 freeAI
0
谷歌发布AI生成文本水印技术SynthID Text,助力开发者识别AI内容

Hugging Face

谷歌发布AI生成文本水印技术SynthID Text,助力开发者识别AI内容

谷歌近日宣布,其名为SynthID Text的技术现已向开发者全面开放。这项技术能够让开发者为生成式AI模型编写的文本添加水印,并能够检测这些文本是否由AI生成。SynthID Text可以从Hugging Face和谷歌的Responsible GenAI Toolkit平台下载。

“我们正在开源我们的SynthID Text水印工具,”谷歌在其X平台上发布的一篇帖子中写道,“该工具免费提供给开发者和企业使用,帮助他们识别其AI生成的内容。”

那么,SynthID Text究竟是如何工作的呢?

当生成式模型接收到一个提示,例如“你最喜欢的水果是什么?”时,模型会预测哪个“令牌”最有可能跟随另一个——一次一个令牌。令牌可以是单个字符或单词,是生成模型处理信息的基本单位。模型为每个可能的令牌分配一个分数,即该令牌被包含在输出文本中的百分比机会。SynthID Text通过“调节令牌生成的可能性”来插入额外的信息,谷歌表示。

“模型选择的词汇与调整后的概率分数的最终模式被视为水印,”谷歌在其博客文章中写道,“这种分数模式与预期模式进行比较,以帮助SynthID检测文本是否由AI工具生成,或者是否来自其他来源。”

谷歌声称,自今年春天以来,SynthID Text已集成到其Gemini模型中,不会影响文本生成的质量、准确性或速度,并且即使在文本被裁剪、改写或修改后,水印仍然有效。

然而,谷歌也承认其水印技术存在局限性。例如,SynthID Text在处理短文本、从另一种语言重写或翻译的文本,或回答事实性问题时表现不佳。“在回答事实性提示时,调整令牌分布而不影响事实准确性的机会较少,”谷歌解释道,“这包括像‘法国的首都是什么?’或‘背诵一首威廉·华兹华斯的诗’这样的查询。”

谷歌并不是唯一一家致力于AI文本水印技术的公司。OpenAI多年来一直在研究水印方法,但由于技术和商业考虑,推迟了其发布。

如果文本水印技术被广泛采用,可能会扭转当前不准确但越来越流行的“AI检测器”的局面,这些检测器错误地标记了以更通用语气撰写的文章和论文。但问题是,这些技术会被广泛采用吗?一个组织的提议标准或技术会胜过其他组织吗?

可能很快就会有法律机制迫使开发者采取行动。中国政府已经引入了AI生成内容的强制水印,加利福尼亚州也在考虑采取类似措施。

情况紧迫。根据欧洲联盟执法机构的一份报告,到2026年,90%的在线内容可能是合成生成的,这将带来新的执法挑战,涉及虚假信息、宣传、欺诈和欺骗。根据AWS的一项研究,由于AI翻译的广泛使用,目前网络上近60%的句子可能是AI生成的。

© 版权声明

相关文章

暂无评论

暂无评论...