
ElevenLabs
语音AI初创公司ElevenLabs在周三推出了一项新功能,该功能允许用户上传不同类型的内容,以创建一个多扬声器的播客,这与Google的NotebookLM类似。
这项名为GenFM的功能可以在公司的iOS应用ElevenLabs Reader上找到。目前,GenFM支持32种语言,包括英语、印地语、葡萄牙语、中文、西班牙语、法语、德语、日语和其他语言。
要使用GenFM,您首先需要上传一个YouTube视频、文本或文档。然后,该应用会自动选择两个声音来创建播客。该公司表示,有十几种声音可供选择。
当应用准备AI生成的播客时,您可能会看到一些有趣的屏幕,比如“撒一些嗯嗯声”和“添加一些思考的停顿”。在一个工具帮助人类去除“嗯”和“啊”的时代,ElevenLabs正在为其AI生成的播客添加人类元素。
ElevenLabs负责移动增长的Jack McDermott通过电子邮件告诉我们:“我们讨论了应该引入多少‘嗯’、‘啊’、‘嗯嗯’/笑声/呼吸等人类对话填充物或叠加层——我们旨在在自然的人类对话和提供内容实用性之间找到正确的平衡。”
“当我们看那些优秀的长播客时,我们发现更少的中断和更自然、更深入的对话流程,”他说。“这正是我们在使音频叙事更易于访问各种声音和语言时所追求的体验。”
展望未来,ElevenLabs计划支持更多的定制化,并能够添加多个来源来创建一个生成的AI播客。
在九月,Google推出了从您提供的来源创建AI生成的对话的能力,使用NotebookLM。一个月后,该公司添加了用户定制这些AI生成的播客输出的能力。
本月早些时候,ElevenLabs宣布它将投资$1100万到波兰的初创企业生态系统,并在华沙开设一个办公室,这将是公司的研发中心,以吸引当地的AI人才。该公司还表示,它正在扩展到印度,在那里它已经雇佣了一个业务主管,并正在建立一个团队。该公司还为客户推出了对话AI代理。