字数 648,阅读大约需 4 分钟

OpenAI图像生成技术:创新、挑战与未来
OpenAI最近向开发者开放了其最新的图像生成技术API,这一举措不仅提升了ChatGPT用户的体验,还因其能够创建逼真的吉卜力风格照片和‘AI动作人物’而迅速走红网络。这一技术的成功推出为OpenAI带来了数百万的新注册用户,但同时也对公司的服务能力提出了巨大挑战。
技术亮点:gpt-image-1模型
支撑这一功能的gpt-image-1模型是一种本机多模态模型,它能够跨不同风格创建图像、遵循定制指南、利用世界知识并渲染文本。这使得开发者能够根据需求生成多样化的图像内容。
开发控制与安全措施
开发者可以利用gpt-image-1同时生成多张图像,并通过调整生成质量来控制速度。此外,OpenAI还实施了与ChatGPT相同的安全措施,包括限制生成违反公司政策的内容。开发者可以调整内容审核敏感度,以适应不同的需求。所有由gpt-image-1生成的图像都将带有C2PA元数据水印,以便在支持的平台和应用中识别为AI生成。
企业应用与定价策略
包括Adobe、Airtable、Wix、Instacart、GoDaddy、Canva和Figma在内的知名企业已经开始使用或测试gpt-image-1模型。例如,Figma Design平台现在允许用户通过gpt-image-1生成和编辑图像,而Instacart则正在测试使用该模型为食谱和购物清单生成图像。
OpenAI的定价策略为每百万输入文本代币5美元,每百万输入图像代币10美元,以及每百万输出图像代币40美元。这对于低、中、高质量的方形图像分别相当于约2美分、7美分和19美分的生成成本。
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...