谷歌发布AI生成文本水印技术SynthID Text，助力开发者识别AI内容

Hugging Face

谷歌发布AI生成文本水印技术SynthID Text，助力开发者识别AI内容

谷歌近日宣布，其名为SynthID Text的技术现已向开发者全面开放。这项技术能够让开发者为生成式AI模型编写的文本添加水印，并能够检测这些文本是否由AI生成。SynthID Text可以从Hugging Face和谷歌的Responsible GenAI Toolkit平台下载。

“我们正在开源我们的SynthID Text水印工具，”谷歌在其X平台上发布的一篇帖子中写道，“该工具免费提供给开发者和企业使用，帮助他们识别其AI生成的内容。”

那么，SynthID Text究竟是如何工作的呢？

当生成式模型接收到一个提示，例如“你最喜欢的水果是什么？”时，模型会预测哪个“令牌”最有可能跟随另一个——一次一个令牌。令牌可以是单个字符或单词，是生成模型处理信息的基本单位。模型为每个可能的令牌分配一个分数，即该令牌被包含在输出文本中的百分比机会。SynthID Text通过“调节令牌生成的可能性”来插入额外的信息，谷歌表示。

“模型选择的词汇与调整后的概率分数的最终模式被视为水印，”谷歌在其博客文章中写道，“这种分数模式与预期模式进行比较，以帮助SynthID检测文本是否由AI工具生成，或者是否来自其他来源。”

谷歌声称，自今年春天以来，SynthID Text已集成到其Gemini模型中，不会影响文本生成的质量、准确性或速度，并且即使在文本被裁剪、改写或修改后，水印仍然有效。

然而，谷歌也承认其水印技术存在局限性。例如，SynthID Text在处理短文本、从另一种语言重写或翻译的文本，或回答事实性问题时表现不佳。“在回答事实性提示时，调整令牌分布而不影响事实准确性的机会较少，”谷歌解释道，“这包括像‘法国的首都是什么？’或‘背诵一首威廉·华兹华斯的诗’这样的查询。”

谷歌并不是唯一一家致力于AI文本水印技术的公司。OpenAI多年来一直在研究水印方法，但由于技术和商业考虑，推迟了其发布。

如果文本水印技术被广泛采用，可能会扭转当前不准确但越来越流行的“AI检测器”的局面，这些检测器错误地标记了以更通用语气撰写的文章和论文。但问题是，这些技术会被广泛采用吗？一个组织的提议标准或技术会胜过其他组织吗？

可能很快就会有法律机制迫使开发者采取行动。中国政府已经引入了AI生成内容的强制水印，加利福尼亚州也在考虑采取类似措施。

情况紧迫。根据欧洲联盟执法机构的一份报告，到2026年，90%的在线内容可能是合成生成的，这将带来新的执法挑战，涉及虚假信息、宣传、欺诈和欺骗。根据AWS的一项研究，由于AI翻译的广泛使用，目前网络上近60%的句子可能是AI生成的。

# AI头条 # Google

文章版权归作者所有，未经允许请勿转载。

暂无评论

暂无评论...

谷歌发布AI生成文本水印技术SynthID Text，助力开发者识别AI内容

谷歌发布AI生成文本水印技术SynthID Text，助力开发者识别AI内容

苹果智能下周来袭：如何抢先体验新一代生成式AI技术

法国初创公司Upflow转型：从应收账款管理到B2B支付平台

相关文章

暂无评论