标签:AI大模型
摩尔线程开源AI框架,大幅提升大模型训练效率
摩尔线程宣布开源两大AI框架MT-MegatronLM与MT-TransformerEngine,通过FP8混合精度训练策略、高性能算子库muDNN及通信库MCCL的深度融合,显著提升了国产GPU...
金山办公「青丘大模型」:AI技术引领办公软件新革命
金山办公近期提交了名为「青丘大模型」的商标注册申请,涉及科学仪器与网站服务领域。此举标志着公司在AI技术创新和市场扩展上的重要战略调整。文章深入探讨...
DeepSeek概念股飙升:技术突破与政策支持共推科技股热潮
本文深入分析了今日DeepSeek概念股在港股市场的强劲表现,尤其是百度集团-SW、金山云和阿里巴巴-W的股价显著上涨。文章探讨了背后的原因,包括百度文心大模型...
微软与inait合作:模拟大脑AI模型引领未来革新
微软与瑞士初创企业inait达成战略合作,共同开发基于模拟哺乳动物大脑推理能力的新型人工智能模型。这一突破性合作旨在推动金融交易、风险管理工具、个性化建...
2025年开源大模型商业化预言:挑战与机遇
本文深入探讨了李开复关于2025年AI开源大模型商业化的预言,分析了开源在AI领域的重要性、DeepSeek的技术突破及其面临的挑战。文章还讨论了开源模式的不足、...
零一万物发布万智平台:开启AI轻量化新时代
2025年3月17日,零一万物推出了万智企业大模型一站式平台,旨在通过提供高性能GPU支持的DeepSeek全系列模型和轻量化模型解决方案,降低中小企业使用AI的技术...
联想问天WA7785a G3服务器:刷新AI计算性能新纪录
联想近期宣布其问天WA7785a G3服务器在单机部署671B DeepSeek大模型时,实现了高达6708token/s的极限吞吐量,显著超越行业平均水平。这款服务器利用联想万全...
探索Groundlight开源框架:AI视觉推理的新纪元
本文介绍了Groundlight团队最新开源的AI框架,该框架通过创新的梯度比率策略优化(GRPO)方法,显著提升了视觉语言模型(VLM)在图像识别和复杂任务理解中的...
北大团队LIFT框架:革新长文本处理方法的前沿探索
北京大学张牧涵团队提出的LIFT框架为大型语言模型在长文本处理方面带来了革新。通过动态高效的长输入训练、门控记忆适配器以及辅助任务训练,LIFT显著提升了...
搜狗输入法PC版AI助手革新:接入腾讯元宝大模型,效率飙升
搜狗输入法PC版近期宣布其「AI助手」正式接入满血版「腾讯元宝」大模型能力,包括腾讯混元和DeepSeek大模型,无需额外下载软件即可体验。新增「=号」搜索功能...