揭秘开放AI模型许可证中的隐藏限制及其商业影响

字数 1378,阅读大约需 7 分钟

揭秘开放AI模型许可证中的隐藏限制及其商业影响
Google是一家全球领先的科技公司,专注于互联网相关的产品和服务,包括在线广告技术、搜索引擎、云计算、软件和硬件设备。

深入探讨‘开放’AI模型许可证中隐藏的限制及其对商业应用的影响

Google最新发布的Gemma 3模型家族因其高效性而迅速获得赞誉,然而其许可证条款却给商业使用带来了不小的风险。这种情况并非Gemma 3独有,Meta等公司也对其公开可用的模型采用了定制而非行业标准的许可证。这些条款不仅为公司整合这些模型到产品或服务中设置了法律和实际障碍,还引发了关于所谓‘开放’AI模型在商业采纳方面的重大不确定性。

定制许可证引发的担忧

开发者和小企业尤其担忧这些定制许可证,因为它们可能成为潜在的商业威胁。例如,Meta的Llama模型许可证禁止开发者使用其输出来改进其他模型,并限制了月活跃用户超过7000万的公司在未获得额外许可的情况下部署Llama模型。而Gemma的许可证虽然相对宽松,但Google保留远程限制使用的权利,以防止违反其禁止使用政策或适用法律的行为。

这些限制不仅适用于原始模型,还扩展到基于这些模型的衍生作品。例如,基于Gemma生成的合成数据训练的模型也必须遵守Gemma的许可证。这对于没有法律团队或资金聘请律师的小公司来说,采用这些模型将面临巨大的法律风险和成本。

专家观点与行业影响

德国人工智能研究中心的研究员Florian Brand认为,尽管科技巨头高管声称这些许可证是‘开放源代码’,但它们实际上并不符合这一标准。他指出,大多数公司都有一套批准的许可证,如Apache 2.0,而任何定制许可证都会带来麻烦和成本。因此,小公司往往会坚持使用具有标准许可证的模型。

Brand还提到,虽然像Google这样的公司尚未积极执行其定制许可证条款,但这种威胁足以阻止采用。穆迪公司的机器学习总监Han-Chung Lee和Gretel的高级应用科学家Eric Tramel也同意,这些定制许可证使得模型在许多商业场景中不可用。Tramel指出,模型特定的许可证对模型的衍生品和蒸馏做出了具体规定,这引发了对回溯的担忧。他担心,如果一个企业专门为客户生产模型微调,那么基于Gemma数据微调的Llama模型应该采用什么许可证?这将对所有下游客户产生什么影响?

Tramel表示,最令人担忧的情况是,这些模型可能成为一种特洛伊木马。模型铸造厂可以发布开放模型,等待看到使用这些模型开发的业务案例,然后通过勒索或法律手段强行进入成功的垂直领域。例如,Gemma 3看起来是一个可靠的发布,并且可能产生广泛的影响。但由于其许可证结构,市场无法采用它。因此,企业可能会坚持使用可能较弱且不太可靠的Apache 2.0模型。

成功案例与未来展望

尽管存在这些限制,某些模型如Llama仍然能够获得广泛分布。Llama已被下载数亿次,并集成到包括Spotify在内的主要公司的 products中。然而,如果它们采用更宽松的许可证,可能会更加成功。Hugging Face的机器学习和社会负责人Yacine Jernite呼吁像Google这样的提供商转向开放许可证框架,并与用户更直接地合作,以达成广泛接受的条款。

Jernite指出,鉴于这些条款缺乏共识,并且许多基本假设尚未在法庭上得到检验,所有这些主要作为这些参与者的意图声明。但如果某些条款被过于宽泛地解释,许多优秀的工作将发现自己处于不确定的法律地位,这对于建立成功的商业产品的组织来说尤其可怕。

开放源代码倡议的社区负责人Nick Vidal表示,迫切需要能够自由集成、修改和共享的AI模型公司,而无需担心突然的许可证变更或法律模糊性。他指出,当前的AI模型许可证领域充满了混乱、限制性条款和误导性的开放性声明。AI行业应该与已建立的开放源代码原则保持一致,以创建一个真正的开放生态系统,而不是根据公司利益重新定义‘开放’。

通过采用更宽松的许可证框架,AI模型提供商可以促进创新、合作和商业采用,从而推动整个AI生态系统的健康发展。这对于开发者、小企业和整个行业来说都是至关重要的。

© 版权声明

相关文章

暂无评论

暂无评论...