标签：AI语音

革命性AI语音模型Dia：两位本科生的创新奇迹

探索由两位本科生创立的Nari Labs如何在短时间内开发出媲美Google NotebookLM的AI语音模型Dia。这款拥有16亿参数的模型不仅支持个性化语调设置，还能模拟非语...

3个月前

Telli，一家前Y Combinator创业公司，通过其创新的AI语音代理技术为企业客户服务带来革命性变化。该公司在pre-seed轮融资中筹集了360万美元，并以其技术实现...

3个月前

Amazon推出了新一代AI语音模型Nova Sonic，该模型在语音处理和自然音质生成方面取得了显著进展。Nova Sonic不仅在成本效益、多语言语音识别、多人互动处理、...

3个月前

Phonic由MIT毕业生创立，提供独特的端到端语音技术栈，旨在解决当前AI语音解决方案可靠性不足的问题。通过内部端到端模型训练，Phonic不仅增强了合成语音的可...

3个月前

阿里云通义千问Qwen团队于2025年3月27日发布了Qwen2.5-Omni，这是一款专为全方位多模态感知设计的旗舰模型。它通过创新的Thinker-Talker架构和TMRoPE技术实现...

4个月前

OpenAI近期发布了Advanced Voice Mode的重要更新，旨在提升ChatGPT语音助手的个性化，并显著减少用户在对话中被中断的情况。此次更新不仅改善了用户体验，还...

4个月前

OpenAI最近对其高级语音模式进行了更新，显著提升了ChatGPT在对话中的自然流畅度，减少了打断频率。此次更新不仅优化了用户体验，使免费用户享受无打断的对话...

4个月前

OpenAI近日推出革新性语音转录模型gpt-4o-transcribe，作为Whisper的升级版，在33种语言测试中显著降低了错误率，并在复杂环境下表现出色。集成噪声消除和语...

4个月前

OpenAI最新发布的gpt-4o-mini-tts和gpt-4o-transcribe模型，分别在文本转语音和语音转录领域实现了显著进步。gpt-4o-mini-tts能够生成更加细腻、真实的语音，...

4个月前

Anthropic公司正在开发其旗舰产品Claude的语音模式，这标志着AI交互方式的重大革新。通过更自然的用户界面和多模态交互的拓展，Claude语音模式有望在快速增长...

4个月前

12 3…6