标签：AI大模型

COMET技术：大模型训练效率革命性突破

字节跳动豆包大模型团队推出COMET技术，成功攻克混合专家模型（MoE）架构瓶颈，通过细粒度计算-通信重叠和自适应工作负载分配，实现1.7倍的训练效率提升及40%...

4个月前

本文深入探讨了微软CEO萨提亚・纳德拉关于AI模型商品化的观点及其对行业的深远影响。随着AI技术的发展，语言模型逐渐走向标准化和商品化，企业战略重点需从单...

4个月前

华为近期公布了一项名为“一种AI模型的生成方法及装置”的专利，通过创新的优化机制显著提升了AI模型生成效率，并降低了资源消耗。该专利采用全局寻优算法优化...

4个月前

IBM最新发布的Granite 3.2系列AI模型，通过引入视觉语言模型（VLM）、思维链功能、小型化的安全模型Granite Guardian以及可言语化信心功能，在文档处理、推理...

4个月前

本文深入探讨了腾讯最新发布的HunyuanVideo-I2V图生视频模型，通过对其技术原理、创新功能及其在开源社区中的反响进行分析，揭示了其为创作者和开发者带来的...

4个月前

深入剖析新开普自主研发的星普大模型，通过SFT与RL训练技术的完美结合，实现了在降低算力消耗至1/20的同时保持了与顶级模型相近的智能推理效果。这一突破不仅...

4个月前

智源研究院与高校合作推出的BGE-VL多模态向量模型，通过创新的MegaPairs数据合成技术，在图文检索和组合图像检索等关键任务中展现出卓越性能。该模型不仅在零...

4个月前

本文深入探讨了阿里云推出的QwQ-32B大型语言模型如何通过稀疏专家混合系统（SMoE）和分层注意力机制实现参数效率的重大突破，以及采用三阶段强化学习框架提升...

4个月前

探索Dynasor-CoT如何通过动态探针阵列、语义熵评估和犹豫词汇检测等技术革新大型语言模型的推理效率。该系统不仅显著减少了token消耗，还在保持或提升准确率...

4个月前

本文深入探讨了基于Transformer架构的大模型在处理信息时面临的挑战，特别是所谓的‘大模型幻觉’现象。通过分析其技术根源、人类认知偏见的影响，以及企业治理...

4个月前

1…7 8910 11…21