标签:AI大模型
软银支持的亿万富翁豪掷2.3亿美元,印度AI初创公司Krutrim迎来高光时刻
软银支持的亿万富翁、Ola创始人Bhavish Aggarwal将向印度AI初创公司Krutrim投资2.3亿美元。Krutrim计划开源AI模型、与英伟达合作打造超级计算机,在印度语言...
DeepSeek的Janus – Pro:AI领域的震撼变革
本文深入剖析DeepSeek发布的开源多模态AI模型Janus - Pro。介绍其模型特点、性能优势及技术创新点,与竞品对比展现优势。探讨其对美股市场冲击及原因,分析Op...
LLM问题生成首次与人类正面交锋,伯克利研究揭秘
本文聚焦伯克利等发布的研究,首次多维度对比LLM与人类在问题生成任务中的表现。研究设计独特提示词与上下文构建方式,从与答案无关及有关的指标评估,揭示LL...
OLMo2:颠覆LLM格局,开启开源新时代
本文介绍非营利研究机构AI2推出的OLMo2模型,其在LLM领域表现卓越,包含7B和13B型号,性能超越同类开源模型,且全方位开源。训练过程分三阶段,有诸多创新举...
震撼!阿里Qwen团队发布能控PC和手机的AI模型Qwen2.5-VL
阿里巴巴Qwen团队于1月27日发布了新的AI模型Qwen2.5-VL,该模型可执行多种文本和图像分析任务,能解析文件、理解视频等,还可控制PC和手机。在一些评估中优于...
中国DeepSeek引发AI行业热议,技术突破背后暗藏哪些玄机?
本周初,中国AI公司DeepSeek发布推理模型R1的开放版本,在科技行业引发诸多讨论。风投家盛赞其突破,其模型在部分AI基准测试中表现出色,且训练成本低。对此...
DeepSeek AI助手登顶App Store,中国AI低成本崛起引关注
近日,中国人工智能公司DeepSeek发布推理模型R1开放版本,其AI助手登顶苹果App Store免费应用榜首。该模型性能匹敌甚至超越OpenAI o1模型,训练成本却仅560万...
Anthropic新功能Citations:降低AI错误的利器
Anthropic于周四推出名为Citations的新功能,该功能可让开发者将Claude系列AI答案与源文档关联,提供详细引用,能减少AI幻觉等错误。目前仅部分模型支持,且...
Meta首席AI科学家:新范式将启“机器人十年”
Meta首席AI科学家Yann LeCun在达沃斯“技术辩论”会上预测,未来3 - 5年将诞生超越当下生成式AI和LLM的新AI架构范式,接下来十年或成“机器人十年”。LLM存在局限...
联通重磅发布!元景思维链大模型性能超GPT-4
中国联通旗下联通数据智能有限公司发布元景思维链大模型并全面开源。该模型具备强大慢思考及多学科通用推理能力,性能超越GPT-4等主流模型。通过两种自适应策...