AI大模型战争-阿里百度反击字节，行业迎来掀桌子牌局

AI头条1年前 (2024)更新 freeAI

5月15日，字节才对外宣布豆包大模型正式开启对外服务，豆包通用模型pro-32k版、pro-128k版在企业市场的推理输入价格仅为0.0008元/千tokens、0.005元/千tokens，较行业降幅达99.3%、95.8%，并声称已经击穿了大模型行业的最底价，成为“价格屠夫”，在行业内掀起巨大波澜。

字节豆包大模型

后付费（按tokens使用量付费）

按tokens使用量（输入文本+输出文本）计费，每小时出账，按量后付费。

模型提供方	模型	上下文长度	服务类型	定价（单位：元/千tokens）	计费方式	免费额度
智谱AI	GLM3-130B	8K	推理服务	免费限量测试
智谱AI	GLM3-130B金融模型	8K	推理服务	免费限量测试
月之暗面	Moonshot-v1-8K	8K	推理服务	0.012	后付费	50万tokens
	Moonshot-v1-32K	32K	推理服务	0.024	后付费	50万tokens
	Moonshot-v1-128K	128K	推理服务	0.06	后付费	50万tokens
字节跳动	Doubao-lite-4k （包括分支版本lite-character）	4K	推理服务（输入）	0.0003	后付费	50万tokens
	Doubao-lite-4k （包括分支版本lite-character）	4K	推理服务（输出）	0.0006	后付费	50万tokens
	Doubao-lite-32k	32K	推理服务（输入）	0.0003	后付费	50万tokens
	Doubao-lite-32k	32K	推理服务（输出）	0.0006	后付费	50万tokens
	Doubao-lite-128k	128K	推理服务（输入）	0.0008	后付费	50万tokens
	Doubao-lite-128k	128K	推理服务（输出）	0.0010	后付费	50万tokens
	Doubao-pro-4k （包括分支版本pro-character、pro-functioncall）	4K	推理服务（输入）	0.0008	后付费	50万tokens
	Doubao-pro-4k （包括分支版本pro-character、pro-functioncall）	4K	推理服务（输出）	0.0020	后付费	50万tokens
	Doubao-pro-32k	32K	推理服务（输入）	0.0008	后付费	50万tokens
	Doubao-pro-32k	32K	推理服务（输出）	0.0020	后付费	50万tokens
	Doubao-pro-128k	128K	推理服务（输入）	0.0050	后付费	50万tokens
	Doubao-pro-128k	128K	推理服务（输出）	0.0090	后付费	50万tokens
Meta	Llama3-8B（开源）	8K	推理服务	免费限量测试
Meta	Llama3-70B（开源）	8K	推理服务	免费限量测试
Mistral AI	Mistral-7B（开源）	32K	推理服务	免费限量测试
百川智能	baichuan-7B（开源）	4K	推理服务	免费限量测试
Databricks	Dolly-V2-12B（开源）	2K	推理服务	免费限量测试

预付费（模型单元）

模型单元是调用某个特定模型的 TPM（Tokens Per Minute，每分钟tokens数量）配额，购买后无需再为 Tokens 消耗付费

模型提供方	模型	计费项	支持TPM	定价（单位：元/个）	计费方式
字节跳动	Doubao-lite-4k	模型单元（包天）	10K	25	预付费
	Doubao-lite-4k	模型单元（包月）	10K	600	预付费
	Doubao-lite-32k	模型单元（包天）	10K	25	预付费
	Doubao-lite-32k	模型单元（包月）	10K	600	预付费
	Doubao-lite-128k	模型单元（包天）	10K	100	预付费
	Doubao-lite-128k	模型单元（包月）	10K	2400	预付费
	Doubao-pro-4k	模型单元（包天）	10K	85	预付费
	Doubao-pro-4k	模型单元（包月）	10K	2000	预付费
	Doubao-pro-32k	模型单元（包天）	10K	85	预付费
	Doubao-pro-32k	模型单元（包月）	10K	2000	预付费
	Doubao-pro-128k	模型单元（包天）	10K	340	预付费
	Doubao-pro-128k	模型单元（包月）	10K	8000	预付费

然而仅隔一周，这个地板价就被阿里击穿了。5月21日，阿里云发布降价公告，将旗下通义千问的多款商业化及开源模型进行大幅降价。对标GPT-4的商业化模型Qwen-Long的API（应用程序编程接口）输入价格从0.02元/千tokens降至0.0005元/千tokens，直降97%；输出价格从0.02元/千tokens降至0.002元/千tokens，直降90%。

在阿里宣布降价不久后，百度也迅速加入战团，直接掀桌子，宣布免费，百度智能云发布公告称，百度文心大模型的两款主力模型ENIRESpeed、ENIRELite将全面免费，并即刻生效。

大模型降价潮来临，行业面临竞争压力

在全球范围内，各大模型制造商的较量日趋白热化，大模型市场价格战已悄然打响。价格的逐渐下滑可能会加速商业化进程，促使更多的需求如微调和推理的出现，从而带动国内人工智能（AI）应用和国产算力的发展。

对于B端企业客户来说，大模型的使用成本将会大大降低，性价比也随之提高，用户体验和满意度也将有所提升，这将推动他们在更多业务领域采用大模型进行赋能。对于应用层的初创公司来说，价格战无疑是一大利好，因为这将使得大模型的调用成本大幅度下降，有利于这些公司加快创新速度，开发出更多商业化的大模型应用，从而推动大模型技术的普及。

对于下游企业来说，推理成本的进一步降低，有望使AI应用行业迎来成本拐点。同时，越来越多的C端用户有望免费享用基本AI应用，大量的访问量将有助于企业提升模型服务能力，形成良性循环。

总的来说，降低成本是推动大模型快速进入”价值创造阶段“的重要因素，只有更低的价格才能真正满足企业的复杂业务需求，充分体现大模型的应用价值。虽然模型终端价格的降低可能会促使大模型企业加强对上游成本的控制，但当前我国企业正处在AI转型的关键期，低成本环境下，AI模型生态将更加完善，终端应用也将涌现出一批具有创新性的应用。

# AI头条 # ai # AI大模型

文章版权归作者所有，未经允许请勿转载。

暂无评论

暂无评论...

AI大模型战争-阿里百度反击字节，行业迎来掀桌子牌局

字节豆包大模型

后付费（按tokens使用量付费）

预付费（模型单元）

2024微软Build年度全球开发者大会AI PC全面出击

2024年微软Build大会-AI全面出击

相关文章

暂无评论