标签:AI大模型
元强化微调(MRT):大语言模型推理效率革命
元强化微调(MRT)是由卡内基梅隆大学与HuggingFace联合推出的一项革新性技术,专注于提升大语言模型在测试阶段的计算效率。通过平衡探索与利用,MRT不仅大幅提...
揭秘百万美元实验:重塑大语言模型训练法则
阶跃星辰研究团队通过耗资百万美元的大规模实验,利用近100万NVIDIA H800 GPU小时的算力,训练了3,700个不同规模的模型,揭示出Step Law缩放规律。这一发现不...
超半数美国成年人体验AI聊天机器人:趋势、互动与未来
深入调查显示,52%的美国成年人已体验过AI聊天机器人如ChatGPT、Gemini等的魅力。这些AI大语言模型不仅在个人生活中扮演重要角色,还在工作场景中提升了超过...
阶跃星辰与智元机器人携手,开创大模型与具身智能新纪元
上海阶跃星辰智能科技有限公司与智元机器人达成深度战略合作协议,共同探索大模型技术和具身机器人的融合。双方将在世界模型技术研发、具身智能数据合作、新...
Reka Flash 3:高效能低延迟的开源AI模型
Reka AI推出了全新的开源模型Reka Flash 3,这是一款拥有21亿参数的通用推理模型。它从零开始构建,结合了公开及合成数据集进行训练,并通过预算强制机制实现...
蚂蚁医疗大模型:开启医疗AI新纪元
蚂蚁医疗团队研发的蚂蚁医疗大模型以高分荣登MedBench评测榜单,凭借基于强化学习的新一代医疗推理模型实现了多模态交互,极大提升了医疗服务质量和效率。与...
谷歌开源Gemma-3:引领多模态AI新潮流
谷歌最新开源的多模态大模型Gemma-3,凭借其创新设计、低算力需求和高性能表现,成为AI领域的新焦点。该模型支持140种语言,并在对话、长文本处理及多模态任...
革新多模态情感识别:阿里通义开源R1-Omni模型
阿里通义实验室近期开源了R1-Omni模型,这一模型通过创新的两阶段训练方法——冷启动微调和强化学习与可验证奖励(RLVR)机制,显著提升了多模态情感识别任务中...
探索小红书AI职场:虚拟领导与AI员工的奇妙互动
本文探讨了在小红书上兴起的一种新奇现象——通过BotGroup应用实现的AI职场模拟。用户可以扮演虚拟领导,管理一群具有独特个性的AI模型,如DeepSeek、元宝等,...
Flower Labs发布创新分布式云平台Flower Intelligence,革新AI模型服务
Flower Labs推出了名为Flower Intelligence的分布式云平台,旨在为AI模型提供高效、灵活且注重隐私的服务。该平台支持在本地和私有云间智能切换处理任务,并...