亚马逊发布全新多模态AI模型Nova，引领智能时代新变革

Amazon Web Services

亚马逊发布全新多模态AI模型Nova

亚马逊在其云计算部门Amazon Web Services (AWS)的re:Invent大会上宣布推出名为Nova的全新多模态生成AI模型家族。Nova包含四种文本生成模型：Micro、Lite、Pro和Premier，以及图像生成模型Nova Canvas和视频生成模型Nova Reel。

Nova模型专为15种语言优化（主要以英语为主），具有不同大小和能力。Micro模型仅处理文本输入和输出，但提供最低的延迟速度——处理文本和生成响应最快。Lite模型可以合理快速地处理图像、视频和文本输入。Pro模型提供准确度、速度和成本的平衡组合，适用于一系列任务。Premier模型能力最强，设计用于复杂工作负载。Pro和Premier模型，像Lite一样，可以分析文本、图像和视频。所有三个模型都非常适合处理文档、总结图表、会议和图表等任务。AWS将Premier定位为更多“教师”模型，用于创建调整后的定制模型，而不是单独使用的模型。

Canvas和Reel是AWS在生成媒体方面最强有力的尝试。Canvas允许用户使用提示生成和编辑图像（例如，去除背景）并提供对生成图像的色彩方案和布局的控制。Reel模型更为雄心勃勃，可以从提示或参考图像创建长达六秒的视频。使用Reel，用户可以调整相机运动以生成具有平移、360度旋转和缩放的视频。Reel目前限制为六秒视频（大约需要三分钟生成），但AWS表示能够创建两分钟长视频的版本“即将推出”。

亚马逊强调，Canvas和Reel都具有“内置”的负责任使用控制，包括水印和内容审核。AWS在其博客文章中扩展了保障措施，称Nova“扩展了其安全措施，以打击错误信息的传播、儿童性虐待材料和化学、生物、放射性或核风险。”

接下来，Nova将致力于在2025年第一季度推出一款语音到语音模型，以及在2025年中期推出一款“任何到任何”模型。语音到语音模型还将能够解释口头和非口头提示，如语调和节奏，并提供自然、“类似人类”的声音。至于任何到任何模型，理论上可以为翻译器、内容编辑到AI助手等应用程序提供动力。

# AI头条 # ai # AI大模型 # 企业级AI

文章版权归作者所有，未经允许请勿转载。

暂无评论

暂无评论...

亚马逊发布全新多模态AI模型Nova，引领智能时代新变革

亚马逊发布全新多模态AI模型Nova

Clarifai引领AI新纪元：跨平台智能资源管理

AI新突破：亚马逊云服务如何精准打击AI幻觉问题？

相关文章

暂无评论