5月15日,字节才对外宣布豆包大模型正式开启对外服务,豆包通用模型pro-32k版、pro-128k版在企业市场的推理输入价格仅为0.0008元/千tokens、0.005元/千tokens,较行业降幅达99.3%、95.8%,并声称已经击穿了大模型行业的最底价,成为“价格屠夫”,在行业内掀起巨大波澜。
字节豆包大模型
后付费(按tokens使用量付费)
按tokens使用量(输入文本+输出文本)计费,每小时出账,按量后付费。
模型提供方 | 模型 | 上下文长度 | 服务类型 | 定价(单位:元/千tokens) | 计费方式 | 免费额度 |
GLM3-130B | 8K | 推理服务 | 免费限量测试 | |||
GLM3-130B金融模型 | 8K | 推理服务 | 免费限量测试 | |||
月之暗面 | Moonshot-v1-8K | 8K | 推理服务 | 0.012 | 后付费 | 50万tokens |
Moonshot-v1-32K | 32K | 推理服务 | 0.024 | 后付费 | 50万tokens | |
Moonshot-v1-128K | 128K | 推理服务 | 0.06 | 后付费 | 50万tokens | |
字节跳动 | Doubao-lite-4k | 4K | 推理服务(输入) | 0.0003 | 后付费 | 50万tokens |
推理服务(输出) | 0.0006 | 后付费 | ||||
Doubao-lite-32k | 32K | 推理服务(输入) | 0.0003 | 后付费 | 50万tokens | |
推理服务(输出) | 0.0006 | 后付费 | ||||
Doubao-lite-128k | 128K | 推理服务(输入) | 0.0008 | 后付费 | 50万tokens | |
推理服务(输出) | 0.0010 | 后付费 | ||||
Doubao-pro-4k | 4K | 推理服务(输入) | 0.0008 | 后付费 | 50万tokens | |
推理服务(输出) | 0.0020 | 后付费 | ||||
Doubao-pro-32k | 32K | 推理服务(输入) | 0.0008 | 后付费 | 50万tokens | |
推理服务(输出) | 0.0020 | 后付费 | ||||
Doubao-pro-128k | 128K | 推理服务(输入) | 0.0050 | 后付费 | 50万tokens | |
推理服务(输出) | 0.0090 | 后付费 | ||||
Meta | Llama3-8B(开源) | 8K | 推理服务 | 免费限量测试 | ||
Llama3-70B(开源) | 8K | 推理服务 | 免费限量测试 | |||
Mistral AI | Mistral-7B(开源) | 32K | 推理服务 | 免费限量测试 | ||
百川智能 | baichuan-7B(开源) | 4K | 推理服务 | 免费限量测试 | ||
Databricks | Dolly-V2-12B(开源) | 2K | 推理服务 | 免费限量测试 |
预付费(模型单元)
模型单元是调用某个特定模型的 TPM(Tokens Per Minute,每分钟tokens数量)配额,购买后无需再为 Tokens 消耗付费
模型提供方 | 模型 | 计费项 | 支持TPM | 定价(单位:元/个) | 计费方式 |
字节跳动 | Doubao-lite-4k | 模型单元(包天) | 10K | 25 | 预付费 |
模型单元(包月) | 10K | 600 | 预付费 | ||
Doubao-lite-32k | 模型单元(包天) | 10K | 25 | 预付费 | |
模型单元(包月) | 10K | 600 | 预付费 | ||
Doubao-lite-128k | 模型单元(包天) | 10K | 100 | 预付费 | |
模型单元(包月) | 10K | 2400 | 预付费 | ||
Doubao-pro-4k | 模型单元(包天) | 10K | 85 | 预付费 | |
模型单元(包月) | 10K | 2000 | 预付费 | ||
Doubao-pro-32k | 模型单元(包天) | 10K | 85 | 预付费 | |
模型单元(包月) | 10K | 2000 | 预付费 | ||
Doubao-pro-128k | 模型单元(包天) | 10K | 340 | 预付费 | |
模型单元(包月) | 10K | 8000 | 预付费 |
然而仅隔一周,这个地板价就被阿里击穿了。5月21日,阿里云发布降价公告,将旗下通义千问的多款商业化及开源模型进行大幅降价。对标GPT-4的商业化模型Qwen-Long的API(应用程序编程接口)输入价格从0.02元/千tokens降至0.0005元/千tokens,直降97%;输出价格从0.02元/千tokens降至0.002元/千tokens,直降90%。
在阿里宣布降价不久后,百度也迅速加入战团,直接掀桌子,宣布免费,百度智能云发布公告称,百度文心大模型的两款主力模型ENIRESpeed、ENIRELite将全面免费,并即刻生效。
大模型降价潮来临,行业面临竞争压力
在全球范围内,各大模型制造商的较量日趋白热化,大模型市场价格战已悄然打响。价格的逐渐下滑可能会加速商业化进程,促使更多的需求如微调和推理的出现,从而带动国内人工智能(AI)应用和国产算力的发展。
对于B端企业客户来说,大模型的使用成本将会大大降低,性价比也随之提高,用户体验和满意度也将有所提升,这将推动他们在更多业务领域采用大模型进行赋能。对于应用层的初创公司来说,价格战无疑是一大利好,因为这将使得大模型的调用成本大幅度下降,有利于这些公司加快创新速度,开发出更多商业化的大模型应用,从而推动大模型技术的普及。
对于下游企业来说,推理成本的进一步降低,有望使AI应用行业迎来成本拐点。同时,越来越多的C端用户有望免费享用基本AI应用,大量的访问量将有助于企业提升模型服务能力,形成良性循环。
总的来说,降低成本是推动大模型快速进入”价值创造阶段“的重要因素,只有更低的价格才能真正满足企业的复杂业务需求,充分体现大模型的应用价值。虽然模型终端价格的降低可能会促使大模型企业加强对上游成本的控制,但当前我国企业正处在AI转型的关键期,低成本环境下,AI模型生态将更加完善,终端应用也将涌现出一批具有创新性的应用。