![Ai2 AI领域新突破:Ai2发布挑战Meta Llama的新语言模型](https://aimgsgoheap.codexiu.cn/2024/11/2024-11-28-allenai-595b919aa2634c4196334b512ed6bd6f.webp)
Ai2
在人工智能领域,Ai2发布了全新的语言模型OLMo 2,与Meta的Llama形成竞争。Ai2是由微软联合创始人Paul Allen创立的非营利AI研究机构,致力于开发开源的AI模型。OLMo 2系列包括两个模型:一个拥有70亿参数的OLMo 7B和一个拥有130亿参数的OLMo 13B。参数数量大致对应于模型的问题解决能力,参数越多,模型性能通常越好。
OLMo 2系列模型能够执行多种基于文本的任务,如回答问题、总结文档和编写代码。为了训练这些模型,Ai2使用了包含5万亿个token的数据集。Token代表原始数据的片段,100万个token大约等于75万字。训练集包括了“高质量过滤”的网站、学术论文、问答讨论板和“合成及人类生成”的数学习题集。
Ai2声称,与早期的OLMo模型相比,OLMo 2在所有任务上的性能都有显著提升,特别是OLMo 7B在性能上超过了Llama 3.1 8B。OLMo 2代表了迄今为止最佳的全开源语言模型。OLMo 2模型及其所有组件都可以从Ai2的官方网站下载,它们遵循Apache 2.0许可,意味着它们可以商业使用。
近期有关开源模型安全性的讨论不断,有报道称Llama模型被中国研究人员用于开发防御工具。当被问及是否担心OLMo被滥用时,Ai2工程师Dirk Groeneveld表示,他认为开源模型的好处最终会超过其潜在的危害。
“是的,开源模型可能会被不当使用或用于意外的目的,”他说。“然而,这种方法也促进了技术进步,导致更符合伦理的模型;是验证和可复制性的前提,因为只有在访问完整堆栈的情况下才能实现这些;并减少了权力的集中,创造了更公平的访问。”
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...