![Google Google Lens升级:实时视频问答功能震撼来袭!](https://aimgsgoheap.codexiu.cn/2024/10/2024-10-07-google-9165e599ca3c45ee9e92d012961a4623.webp)
Google Lens升级:实时视频问答功能震撼来袭!
Google近日对其视觉搜索应用Lens进行了重大升级,新增了实时视频问答功能,让用户能够通过Lens捕捉视频并提问,AI将基于视频内容提供详细解答。
![Google Lens升级:实时视频问答功能震撼来袭!](https://aimgsgoheap.codexiu.cn/2024/10/image-2024-10-08-swan-motor.webp)
实时视频问答功能
英语用户在安装了Google应用的Android和iOS设备上,现在可以通过Lens开始捕捉视频,并就视频中的感兴趣对象提问。Lens的产品管理总监Lou Wang表示,这一功能利用了Google的“定制化”Gemini模型来解析视频和相关问题。Gemini是Google的AI模型家族,为公司众多产品提供支持。
Wang在新闻发布会上举例说:“比如你想了解更多关于某种有趣的鱼的信息,Lens会生成一个概述,解释它们为什么在水中转圈,并提供更多资源和有用信息。”
如何使用新功能
要访问Lens的新视频分析功能,用户必须注册Google的Search Labs计划,并选择加入“AI概述及其他”实验功能。在Google应用中,按住智能手机的快门按钮即可激活Lens的视频捕捉模式。
在录制视频时提问,Lens将链接到由AI概述提供的答案,该功能利用AI总结来自网络的信息。
Wang解释说,Lens利用AI确定视频中最“有趣”和相关的帧,并使用这些帧来“支撑”AI概述的答案。
“这一切都源于对人们如何使用Lens的观察,”Wang说。“如果你降低提问的门槛,并帮助人们满足他们的好奇心,人们会自然而然地接受这一功能。”
竞争对手的动态
Lens的视频功能发布之际,Meta也在为其AR眼镜Ray-Ban Meta预览类似功能。Meta计划为眼镜引入实时AI视频功能,让佩戴者能够就周围环境提问(例如:“这是什么类型的花?”)。
OpenAI也预告了其高级语音模式工具的视频理解功能。最终,高级语音模式——ChatGPT的高级功能——将能够实时分析视频,并根据上下文回答问题。
尽管Google似乎在这场竞争中领先一步,但Lens的异步特性(无法实时聊天)以及功能的实际表现仍需观察。
其他新功能
除了视频分析,Lens现在还可以同时使用图像和文本进行搜索。英语用户,包括未注册Labs的用户,可以在Google应用中按住快门按钮拍照,然后通过语音提问。
此外,Lens还推出了新的电商识别功能。从今天开始,当Lens在Android或iOS设备上识别出产品时,将显示包括价格、优惠、品牌、评价和库存等信息。产品识别功能适用于上传和新拍摄的照片(但不包括视频),目前仅限于部分国家和特定购物类别,如电子产品、玩具和美容。
Wang举例说:“比如你看到一个背包,你喜欢它,你可以用Lens识别该产品,并立即查看你可能想知道的详细信息。”
广告机会
Lens识别的产品结果页面还将显示“相关”的购物广告,提供选项和价格。Google表示,每月约有40亿次Lens搜索与购物相关,对于依赖广告收入的科技巨头来说,这是一个不容错过的机会。