标签：AI语音

Spark-TTS：零样本语音克隆与细粒度控制的革命性突破

Spark-TTS是一款基于Qwen2.5的先进文本转语音系统，以其零样本语音克隆和细粒度语音控制能力在AI社区引发讨论。该系统简化了音频生成步骤，提高了效率，并支...

3个月前

深入探讨Spark-TTS，一种基于Qwen2.5模型的革命性文本转语音系统，它利用BiCodec技术实现高效的声音克隆和定制。通过零样本学习和VoxBox数据集的支持，Spark-...

3个月前

出门问问于2025年3月6日发布了第七代TTS引擎TicVoice 7.0，联合多家顶尖学术机构共同开源了Spark-TTS模型。TicVoice 7.0采用创新的BiCodec编码技术，实现了语...

3个月前

亚马逊旗下的Prime Video正在通过AI辅助配音技术，革新影视内容的本地化进程。此次测试覆盖12部影片，包括不同语言的作品，旨在结合AI与人类专业力量，提供更...

3个月前

人工智能配音初创公司Dubformer获得360万美元种子轮融资，引领情感传输技术的创新。利用先进的机器学习和自然语言处理算法，Dubformer不仅复制声音，还能捕捉...

3个月前

Podcastle推出了全新的AI文本转语音模型Asyncflow v1.0，提供超过450种语音选择，并开放API接口，助力开发者集成。这款基于深度学习的模型不仅能够高度还原语...

3个月前

Podcastle通过升级其语音克隆技术和整合多模态内容创作工具，在AI语音技术领域取得了显著进展。现在，用户只需录制几秒钟的声音即可创建个人语音克隆，相比之...

3个月前

Sesame公司推出的Conversational Speech Model（CSM）在X平台上引起了广泛关注，被誉为能够实现‘像真人说话一样的语音模型’。它通过情感智能、上下文记忆及高...

3个月前

Duolingo通过其AI驱动的沉浸式学习系统革新了语言学习，特别是英语市场成为了业绩增长的新引擎。该系统基于WebRTC架构和声纹识别技术实现了高效的视频通话功...

3个月前

ElevenLabs推出了其首款独立的语音转文本模型Scribe，支持超过99种语言，并在多语言环境下的准确性方面表现出色。Scribe不仅标志着ElevenLabs的技术新突破，...

3个月前