字数 1150,阅读大约需 6 分钟

代码线索暗示Gemini新功能:视频生成
近日,国外媒体Android Authority报道,谷歌在AI数字助理Gemini的功能拓展上动作频繁。在深度情境理解、文件处理优化以及跨应用链接等功能之后,Google应用程序中的代码暗示Gemini将具备视频生成能力,这一消息在人工智能领域引发广泛关注。
代码中的关键线索
此次发现源于Google应用v16.6.23版本的代码。在代码中,“videogen”(视频生成)与“robin”(Gemini功能的代号)一同出现,相关代码文件还包含特定字符串。虽然未挖掘到更多详细代码,但从现有信息判断,“videogen”指代视频生成功能,那些字符串可能指向Gemini中该功能的运行状态提示。
据知名人工智能研究机构Statista报告,2023年全球人工智能市场规模显著增长,生成式AI领域增长尤为突出。视频生成作为生成式AI重要分支,成为各大科技公司竞争焦点。谷歌若将视频生成功能整合到Gemini,有望在竞争中占据有利地位。
谷歌现有视频相关服务情况
谷歌目前已通过Google Vids提供AI视频生成服务。不过,Google Vids并非传统生成式AI系统,它主要引导用户完成构思、脚本、布局、编辑等流程,从想法到视频提供逐步指导。用户可在Google Vids中创建初稿、移除图像背景、生成AI图像、添加画外音以及录制提词器朗读等。
从行业来看,这种引导式视频生成服务已取得一定成绩。据市场调研机构Gartner数据,截至2024年底,Google Vids用户数量突破一定规模,月活跃用户数也达到相当数量。将类似系统整合到Gemini看似顺理成章。一方面,Gemini作为谷歌重要AI数字助理,具备强大语言理解和处理能力,能更好理解用户视频生成需求;另一方面,Google Vids的成功经验为Gemini视频生成功能开发提供借鉴。
Gemini视频生成功能的影响与挑战
对内容创作的影响
若Gemini支持视频生成,对内容创作者而言,将大幅提高创作效率。以往制作高质量视频,从脚本撰写、素材收集到后期剪辑,需耗费大量时间精力,且各环节需专业技能经验。有了Gemini视频生成功能,创作者输入简单文字描述就能快速生成视频,降低创作门槛。
商业领域的机遇
从商业角度,这将为广告、营销等行业带来新机遇。随着全球数字广告支出增长,视频广告占比持续上升。Gemini视频生成功能可帮助企业快速制作个性化广告视频,提升广告效果和营销效率。
教育领域的应用前景
在教育领域,Gemini也有广阔应用前景。教师可利用其生成教学视频,以更生动有趣方式传授知识。随着在线教育普及,视频教学资源需求巨大,Gemini视频生成功能有望满足这一需求,提高在线教育质量和效果。
面临的挑战
然而,Gemini视频生成功能实现面临挑战,如保证生成视频质量和解决版权问题。随着AI生成内容增多,版权纠纷案件数量上升。谷歌需在技术和法律层面找到有效解决方案,确保功能顺利推出和广泛应用。