近日,Google实验室发布了一款新的图像生成工具——Whisk。这个工具让用户能够以图像而非文字作为输入,重新组合并创造一张融合了三个不同元素的新照片:主体、场景以及风格。例如,你可以选择自己的一张照片作为主体,搭配一个未来感的城市景象作为背景,最后选用动漫风格完成整个作品。
Whisk采用了Google最新的图像生成模型——Imagen 3,该模型能够根据用户提供的三张图片自动生成详细的描述,并以此指导图像合成过程。此外,用户还可以添加具体的文本指令来定义更精确的结果,比如“主体正在骑乘一辆悬浮自行车”。由于Whisk专注于从每张图片中提取几个关键特征,因此生成的内容可能不会完全符合预期;例如,生成的人物形象可能会与原图存在差异,包括身高、体重、发型或肤色等方面的变化。不过,用户可以在任何时候查看和编辑这些底层提示信息。
当前,这项实验性服务仅限于美国地区的用户访问,感兴趣的读者可以通过Google实验室了解更多详情。随着技术的发展,预计未来会有更多地区开放使用权限,让更多人体验到这种新颖的艺术创作方式。
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...