字数 1379,阅读大约需 7 分钟

谷歌AI图像混合工具Google Whisk全球上线,覆盖100多个国家
近日,谷歌重磅宣布,其基于人工智能的图像混合工具Google Whisk[1]已在全球100多个国家和地区正式推出。这一消息在人工智能图像生成领域引起广泛关注,为全球众多图像创作者、设计师以及普通爱好者带来全新创作体验。
Google Whisk的功能亮点
Google Whisk并非全新开发,它最初于去年在美国发布,经过优化后推向全球。该工具亮点在于独特的图像混合技术。传统图像生成工具多基于单一文本描述或少量图像元素创作,而Google Whisk允许用户上传三张图像,分别代表主题、场景和风格,随后由谷歌强大的Imagen3模型支持,将三者重新混合生成全新作品。
例如,摄影师若想创作融合奇幻风格的城市风景图,可上传城市建筑照片作为主题,奇幻森林照片作为场景,独特笔触风格画作作为风格参考,Google Whisk能迅速融合这些元素生成奇幻城市风景图像。
不仅如此,用户还能使用文本提示调整整体效果。如在上述例子中,用户可输入“增加一些星空元素”或“让城市建筑看起来更古老”等文本指令,对特定主题、场景或风格微调。这种图像与文本结合的混合方式,极大拓展了图像创作可能性。据相关行业报告,在图像生成领域,能结合多种元素创作的工具,用户满意度比单一元素创作工具高出30%以上,Google Whisk在这方面表现出色。
与竞品的对比——以苹果Image Playground为例
人工智能图像生成领域竞争激烈,谷歌的Google Whisk与苹果的Image Playground功能类似,苹果的Image Playground同样允许用户通过组合不同风格和主题创建图像。然而,Google Whisk借助谷歌的Imagen3模型,在图像生成质量和细节上更具优势。
Imagen3模型经大量数据训练,谷歌官方称其在训练过程中使用超过数十亿张图像数据,涵盖各种场景、主题和风格。这使它在处理复杂图像融合任务时,能生成更细腻、逼真且富有创意的图像。相比之下,苹果的Image Playground虽有独特之处,但在图像生成细节丰富度和复杂场景处理能力上,与Google Whisk存在差距。有专业图像评测机构对两者生成的图像对比测试,结果显示,在复杂场景图像生成方面,Google Whisk生成的图像在细节得分上平均比Image Playground高出15分(满分100分)。
全球覆盖情况与受限地区
Google Whisk此次全球上线,覆盖100多个国家,从美洲到亚洲,从欧洲到非洲,众多用户可体验其创新功能。不过,虽已广泛上线,仍有部分地区因政策或技术限制无法使用,包括印度、印度尼西亚、欧盟和英国。
印度和印度尼西亚人口众多且科技发展迅速,对图像生成工具需求大。欧盟和英国在人工智能领域有严格政策法规和技术标准。谷歌未公布这些地区具体上线时间。以欧盟为例,其在数据隐私保护方面有严格的《通用数据保护条例》(GDPR),谷歌需确保Google Whisk在数据收集、存储和使用过程中符合相关规定,才能在欧盟地区上线。
谷歌在AI领域的持续创新
Google Whisk的推出体现了谷歌在人工智能领域的创新能力。多年来,谷歌持续投入大量资源研发人工智能技术,从早期语音识别到如今图像生成,不断将复杂AI技术转化为用户友好工具。
知名市场调研机构数据显示,谷歌在人工智能研发方面投入逐年增加,去年研发资金超50亿美元。这种持续投入使谷歌在AI技术上保持领先。通过降低AI创作门槛,谷歌让更多人体验到人工智能的便利与乐趣。以图像生成领域为例,过去专业图像创作需掌握复杂图像处理软件和技巧,如今借助Google Whisk这类工具,普通用户也能轻松创作有创意的图像作品,推动了图像创作领域发展,为创意产业注入新活力。