法国AI初创公司Mistral近日发布了其首款多模态模型Pixtral 12B,这一消息在AI界引起了广泛关注。Pixtral 12B是一款拥有120亿参数的模型,大小约为24GB,其参数数量直接关系到模型的解决问题能力,通常参数越多,模型的表现越出色。该模型基于Mistral的文本模型Nemo 12B构建,能够处理任意数量和尺寸的图像,无论是通过URL还是使用base64编码的图像。Pixtral 12B的功能与Anthropic的Claude系列和OpenAI的GPT-4o等其他多模态模型相似,理论上能够执行图像标注和照片中物体计数等任务。
Pixtral 12B的发布不仅是Mistral技术实力的展示,也标志着欧洲AI产业的崛起。Mistral成立仅一年多,已获得64500万美元的融资,估值达到60亿美元,被视为欧洲对标OpenAI的公司。Mistral的战略是通过发布免费的开源模型,提供托管版本的收费服务,以及为企业客户提供咨询服务来实现盈利。
值得注意的是,Pixtral 12B的发布正值AI领域版权争议不断升级之际。大多数生成式AI模型,包括Mistral的其他模型,都是在大量公开的网络数据上训练的,这些数据往往受版权保护。尽管一些模型供应商认为“合理使用”权利允许他们抓取任何公开数据,但许多版权持有者对此持反对态度,并已对OpenAI和Midjourney等大型供应商提起诉讼,试图阻止这一做法。
尽管Pixtral 12B的发布引起了广泛关注,但目前尚无可用的网络演示供公众体验。Mistral的开发者关系负责人Sophia Yang在X平台上表示,Pixtral 12B将很快在Mistral的聊天机器人和API服务平台Le Chat和Le Plateforme上提供测试。此外,Pixtral 12B的开发过程中使用了哪些图像数据尚不清楚,这也引发了业界对其数据来源的猜测。
Mistral的这一重大突破不仅展示了其在AI领域的技术实力,也预示着欧洲AI产业正在崛起,有望挑战OpenAI的霸主地位。随着Pixtral 12B的发布,Mistral将进一步巩固其在AI领域的地位,并为全球AI产业带来新的竞争格局。