标签:AI大模型

零一万物发布万智平台:开启AI轻量化新时代

2025年3月17日,零一万物推出了万智企业大模型一站式平台,旨在通过提供高性能GPU支持的DeepSeek全系列模型和轻量化模型解决方案,降低中小企业使用AI的技术...

联想问天WA7785a G3服务器:刷新AI计算性能新纪录

联想近期宣布其问天WA7785a G3服务器在单机部署671B DeepSeek大模型时,实现了高达6708token/s的极限吞吐量,显著超越行业平均水平。这款服务器利用联想万全...

探索Groundlight开源框架:AI视觉推理的新纪元

本文介绍了Groundlight团队最新开源的AI框架,该框架通过创新的梯度比率策略优化(GRPO)方法,显著提升了视觉语言模型(VLM)在图像识别和复杂任务理解中的...

北大团队LIFT框架:革新长文本处理方法的前沿探索

北京大学张牧涵团队提出的LIFT框架为大型语言模型在长文本处理方面带来了革新。通过动态高效的长输入训练、门控记忆适配器以及辅助任务训练,LIFT显著提升了...

搜狗输入法PC版AI助手革新:接入腾讯元宝大模型,效率飙升

搜狗输入法PC版近期宣布其「AI助手」正式接入满血版「腾讯元宝」大模型能力,包括腾讯混元和DeepSeek大模型,无需额外下载软件即可体验。新增「=号」搜索功能...

百度Ernie 4.5与X1:AI模型的新纪元

百度近期推出的Ernie 4.5和Ernie X1两款AI模型,标志着公司在人工智能领域的新里程碑。Ernie 4.5强调高情商与多模态能力的提升,能够更好地理解人类情感及处...

Cohere Command A:企业级AI的高效低成本解决方案

Cohere最新推出的Command A模型,通过优化的Transformer架构仅需两块GPU即可运行,显著降低企业部署成本。其拥有256K上下文窗口和多语言支持能力,适用于处理...

揭秘AI搜索引擎新闻查询高错误率:挑战与对策

本文深入探讨了AI搜索引擎在新闻查询中面临的高错误率问题,及其对技术、商业和社会带来的挑战。研究表明,多数AI工具在处理新闻信息时表现出超过60%的错误率...

智谱华章获5亿投资,加速GLM大模型创新与数字产业升级

北京智谱华章科技有限公司获得珠海华发集团5亿元战略投资,用于加速GLM大模型的创新和生态发展,并与珠海华发共同建设首个城市级GLM大模型空间。此次合作不仅...

清华团队开源‘赤兔Chitu’:国产AI生态发展的新引擎

清华大学高性能计算研究所与清程极智联合发布了一款名为‘赤兔Chitu’的开源大模型推理引擎,该引擎支持在非英伟达GPU和国产芯片上原生运行FP8精度模型。这一技...
12317