标签：AI语音

亚马逊Alexa+：智能语音助手的新纪元，改变你的生活方式

亚马逊推出了增强版的语音助手Alexa+，通过引入生成式人工智能技术，提升了用户的交互体验。它不仅能够理解长文档并提取关键信息，还能高效处理多任务及智能...

3个月前

本文深入探讨了B站推出的IndexTTS技术，这一技术在中文TTS领域实现了革命性突破。采用创新的汉字-拼音双向Transformer架构和标点驱动的韵律控制系统，显著降...

3个月前

ElevenLabs最新发布的Scribe v1语音转文本模型，在多语言转录准确性上实现了重大突破，超越了包括谷歌Gemini2.0Flash、OpenAI Whisper v3等在内的竞争对手。...

3个月前

Hugging Face推出的FastRTC是一个开源Python库，旨在简化实时音频和视频AI应用的开发过程。它通过自动化处理复杂部分，使开发人员只需几行代码即可创建基本的...

3个月前

ElevenLabs通过其Reader应用程序推出了一项新功能，允许作者创作和发布由AI生成的有声书，并根据用户与内容的互动获得报酬。该平台降低了有声书制作成本，提...

3个月前

OpenAI宣布，其基于GPT-4o mini的高级语音模式现已对免费用户开放，为所有用户提供更自然流畅的对话体验。尽管存在每日使用限制，这仍标志着语音交互技术的重...

3个月前

2025年2月26日，OpenAI宣布免费开放基于GPT-40 mini模型的ChatGPT高级语音模式，为用户提供更加自然流畅的语音交互体验。此模式支持macOS和Windows系统，并提...

3个月前

本文深入解析了科大讯飞对声临奇境的战略投资事件，探讨了这一合作在AI语音赛道上带来的技术整合与产业升级。文章详细分析了资本动向、技术协同性以及产业影...

3个月前

Grok 3通过xAI实验室研发的Transformer-XL架构实现了多模态交互闭环和端到端延迟压缩，显著提升了语音识别准确率和情感计算能力。其创新的十模式动态切换、对...

3个月前

本文深入探讨了Spotify与ElevenLabs合作通过创新AI语音合成技术拓展有声书库的技术架构及其对行业的影响。文中详细解析了ElevenLabs的先进技术栈，包括上下文...

3个月前