标签:AI语音

Amazon Nova Sonic:革新AI语音交互体验

Amazon推出了新一代AI语音模型Nova Sonic,该模型在语音处理和自然音质生成方面取得了显著进展。Nova Sonic不仅在成本效益、多语言语音识别、多人互动处理、...

Phonic:革新AI语音领域的端到端技术栈

Phonic由MIT毕业生创立,提供独特的端到端语音技术栈,旨在解决当前AI语音解决方案可靠性不足的问题。通过内部端到端模型训练,Phonic不仅增强了合成语音的可...

阿里云Qwen2.5-Omni:革新多模态交互体验

阿里云通义千问Qwen团队于2025年3月27日发布了Qwen2.5-Omni,这是一款专为全方位多模态感知设计的旗舰模型。它通过创新的Thinker-Talker架构和TMRoPE技术实现...

OpenAI发布Advanced Voice Mode更新:个性化与减少打断的革命

OpenAI近期发布了Advanced Voice Mode的重要更新,旨在提升ChatGPT语音助手的个性化,并显著减少用户在对话中被中断的情况。此次更新不仅改善了用户体验,还...

OpenAI高级语音模式更新:重塑ChatGPT对话体验

OpenAI最近对其高级语音模式进行了更新,显著提升了ChatGPT在对话中的自然流畅度,减少了打断频率。此次更新不仅优化了用户体验,使免费用户享受无打断的对话...

OpenAI发布gpt-4o-transcribe:开启语音转录新时代

OpenAI近日推出革新性语音转录模型gpt-4o-transcribe,作为Whisper的升级版,在33种语言测试中显著降低了错误率,并在复杂环境下表现出色。集成噪声消除和语...

OpenAI发布gpt-4o-mini-tts和gpt-4o-transcribe:语音技术的新突破

OpenAI最新发布的gpt-4o-mini-tts和gpt-4o-transcribe模型,分别在文本转语音和语音转录领域实现了显著进步。gpt-4o-mini-tts能够生成更加细腻、真实的语音,...

Anthropic的Claude语音模式:AI交互革新与市场影响

Anthropic公司正在开发其旗舰产品Claude的语音模式,这标志着AI交互方式的重大革新。通过更自然的用户界面和多模态交互的拓展,Claude语音模式有望在快速增长...

谷歌云Chirp 3发布:引领智能语音与AI伦理新潮流

谷歌云在伦敦DeepMind总部发布了最新的高清语音模型Chirp 3,通过Vertex AI平台向开发者提供丰富的工具支持,包括248种声音和31种语言的语音合成能力。此外,...

Google Chirp 3:开启语音技术新篇章

Google最新发布的Chirp 3语音模型,为Vertex AI平台带来了多语言支持、高清文本转语音及灵活的应用场景等显著优势。Chirp 3不仅采用了先进的神经网络技术生成...
1235