字数 1415,阅读大约需 8 分钟

谷歌Gemini Live新功能上线:重塑人工智能助手体验
在近期的MWC展会上,谷歌宣布推出Gemini Live的全新功能,这一举措标志着Project Astra与Gemini Live的深度整合正式落地。这些创新功能不仅支持用户共享手机屏幕,还能够通过智能手机摄像头实现实时视频交互,为人工智能助手的使用体验带来了革命性的提升。谷歌发言人Alex Joseph通过邮件确认了这一消息,并指出新功能已开始逐步向用户开放。
用户只需通过一个名为“Share screen with Live”的新按钮,即可轻松实现手机屏幕的共享。一位Reddit用户已率先体验了这一功能,并上传了相关视频。视频中,Gemini能够实时根据用户共享的屏幕信息,准确回答诸如当天日期和当前气温等问题,展示了其出色的实时响应能力。
除了屏幕共享功能,Gemini Live还引入了实时视频解读功能。用户只需打开手机摄像头,Gemini便能对所拍摄的画面进行智能解析,并针对相关问题给出回答。在谷歌发布的示范视频中,用户向Gemini询问哪种颜料最适合用于陶器上釉。Gemini几乎无延迟地提供了详细的建议,充分展现了其强大的实时处理能力。
Project Astra作为谷歌去年推出的AI智能体项目,旨在实现与大型模型的实时视觉和语音交互。其核心特点包括低延迟的音频和视频对话、多语言支持,以及能够记住过去对话中的关键细节,甚至在对话过程中调用谷歌搜索和地图等工具。值得一提的是,Project Astra具备跨设备使用的能力,用户可以在安卓手机或特制眼镜等设备上体验这一功能。
与谷歌在AI领域的迅猛发展形成鲜明对比的是,苹果在Siri的升级上似乎陷入了停滞。据彭博社报道,苹果高管在内部会议中承认,Siri的AI功能升级远未达到预期目标,而许诺已久的Apple Intelligence也迟迟未能兑现。这种发展速度的差距使得苹果在人工智能竞赛中显得相对滞后。
产品亮点与技术优势
- 1. 屏幕共享与实时视频交互:通过“Share screen with Live”按钮,用户能够轻松共享手机屏幕,并与Gemini进行实时视频交互,提升了人工智能助手的实用性和互动性。
- 2. 实时视频解读功能:Gemini能够实时解析用户通过手机摄像头拍摄的画面,并针对相关问题给出智能回答,展示了其强大的实时处理和理解能力。
- 3. Project Astra的核心特点:包括低延迟的音频和视频对话、多语言支持,以及跨设备使用的灵活性,为用户提供了更加便捷和智能的交互体验。
行业对比与未来展望
谷歌在AI领域的快速进展与苹果Siri的升级停滞形成了鲜明对比。根据彭博社的报道,苹果高管已承认Siri的AI功能升级未能达到预期,而Apple Intelligence的推出也一再推迟。这种发展速度的差距可能对苹果在全球AI竞赛中的地位产生影响。
展望未来,随着AI技术的不断进步和行业竞争的加剧,我们可以期待更多创新和改进的出现。这将推动人工智能助手向更加智能、便捷和个性化的方向发展,为用户带来更加丰富的交互体验和实际价值。