![Amazon Web Services 亚马逊发布全新多模态AI模型Nova,引领智能时代新变革](https://aimgsgoheap.codexiu.cn/2024/12/2024-12-04-amazon-c5a45d7b21c84dc79b6c83d5932df68c.webp)
Amazon Web Services
亚马逊发布全新多模态AI模型Nova
亚马逊在其云计算部门Amazon Web Services (AWS)的re:Invent大会上宣布推出名为Nova的全新多模态生成AI模型家族。Nova包含四种文本生成模型:Micro、Lite、Pro和Premier,以及图像生成模型Nova Canvas和视频生成模型Nova Reel。
Nova模型专为15种语言优化(主要以英语为主),具有不同大小和能力。Micro模型仅处理文本输入和输出,但提供最低的延迟速度——处理文本和生成响应最快。Lite模型可以合理快速地处理图像、视频和文本输入。Pro模型提供准确度、速度和成本的平衡组合,适用于一系列任务。Premier模型能力最强,设计用于复杂工作负载。Pro和Premier模型,像Lite一样,可以分析文本、图像和视频。所有三个模型都非常适合处理文档、总结图表、会议和图表等任务。AWS将Premier定位为更多“教师”模型,用于创建调整后的定制模型,而不是单独使用的模型。
Canvas和Reel是AWS在生成媒体方面最强有力的尝试。Canvas允许用户使用提示生成和编辑图像(例如,去除背景)并提供对生成图像的色彩方案和布局的控制。Reel模型更为雄心勃勃,可以从提示或参考图像创建长达六秒的视频。使用Reel,用户可以调整相机运动以生成具有平移、360度旋转和缩放的视频。Reel目前限制为六秒视频(大约需要三分钟生成),但AWS表示能够创建两分钟长视频的版本“即将推出”。
亚马逊强调,Canvas和Reel都具有“内置”的负责任使用控制,包括水印和内容审核。AWS在其博客文章中扩展了保障措施,称Nova“扩展了其安全措施,以打击错误信息的传播、儿童性虐待材料和化学、生物、放射性或核风险。”
接下来,Nova将致力于在2025年第一季度推出一款语音到语音模型,以及在2025年中期推出一款“任何到任何”模型。语音到语音模型还将能够解释口头和非口头提示,如语调和节奏,并提供自然、“类似人类”的声音。至于任何到任何模型,理论上可以为翻译器、内容编辑到AI助手等应用程序提供动力。