标签:AI大模型
预见未来风险:AI安全法规新视角
由Fei-Fei Li共同领导的团队发布了一份关于AI安全法规应预见未来风险的中期报告,旨在指导立法者考虑尚未观察到的风险。报告提倡增加前沿AI实验室工作的透明...
昆仑万维Skywork R1V:开启多模态推理新时代
昆仑万维宣布其Skywork R1V多模态推理模型正式开源,这是中国首个工业界开源的此类模型,标志着中国AI在多模态理解和推理领域迈出了重要一步。Skywork R1V不...
摩尔线程开源AI框架,大幅提升大模型训练效率
摩尔线程宣布开源两大AI框架MT-MegatronLM与MT-TransformerEngine,通过FP8混合精度训练策略、高性能算子库muDNN及通信库MCCL的深度融合,显著提升了国产GPU...
金山办公「青丘大模型」:AI技术引领办公软件新革命
金山办公近期提交了名为「青丘大模型」的商标注册申请,涉及科学仪器与网站服务领域。此举标志着公司在AI技术创新和市场扩展上的重要战略调整。文章深入探讨...
DeepSeek概念股飙升:技术突破与政策支持共推科技股热潮
本文深入分析了今日DeepSeek概念股在港股市场的强劲表现,尤其是百度集团-SW、金山云和阿里巴巴-W的股价显著上涨。文章探讨了背后的原因,包括百度文心大模型...
微软与inait合作:模拟大脑AI模型引领未来革新
微软与瑞士初创企业inait达成战略合作,共同开发基于模拟哺乳动物大脑推理能力的新型人工智能模型。这一突破性合作旨在推动金融交易、风险管理工具、个性化建...
2025年开源大模型商业化预言:挑战与机遇
本文深入探讨了李开复关于2025年AI开源大模型商业化的预言,分析了开源在AI领域的重要性、DeepSeek的技术突破及其面临的挑战。文章还讨论了开源模式的不足、...
零一万物发布万智平台:开启AI轻量化新时代
2025年3月17日,零一万物推出了万智企业大模型一站式平台,旨在通过提供高性能GPU支持的DeepSeek全系列模型和轻量化模型解决方案,降低中小企业使用AI的技术...
联想问天WA7785a G3服务器:刷新AI计算性能新纪录
联想近期宣布其问天WA7785a G3服务器在单机部署671B DeepSeek大模型时,实现了高达6708token/s的极限吞吐量,显著超越行业平均水平。这款服务器利用联想万全...
探索Groundlight开源框架:AI视觉推理的新纪元
本文介绍了Groundlight团队最新开源的AI框架,该框架通过创新的梯度比率策略优化(GRPO)方法,显著提升了视觉语言模型(VLM)在图像识别和复杂任务理解中的...