字数 4668,阅读大约需 24 分钟
一、AI 2025:8大热门赛道深度报道
在科技飞速发展的当下,AI就像一把神奇的钥匙,开启了无数新可能的大门。2025年,AI科技领域更是热闹非凡,多条热门赛道你追我赶,呈现出蓬勃发展的态势。接下来,就让我们深入剖析这8大热门赛道,看看它们的过去、现在与未来。
产品侧
人形机器人:从概念到现实的跨越
还记得2021年,马斯克在首届特斯拉AI Day上公布人形机器人Optimus(擎天柱)概念,那一刻,就像在平静的湖面投下了一颗巨石,激起千层浪,人形机器人的赛道开始热闹起来。随后的日子里,全球巨头纷纷加码,创业团队也如雨后春笋般入局。
到了2023年,AI大模型技术的进步和仿真环境的改进,给人形机器人的发展添了一把旺火。中科院院士姚期智也表示,人形是最适合实现通用具身智能的形态。就像给奔跑的运动员穿上了更轻便、更有力的跑鞋,人形机器人迅速从概念走向实际,从实验室走向室外开放世界。
在刚刚过去的2025年CES上,英伟达的黄仁勋带着人形机器人天团激情开场,14个和他差不多大小的人形机器人在背后列队现身,那场面,简直震撼人心!其中有6个来自中国,这也彰显了中国在人形机器人领域的实力。一周前,英伟达机器人与边缘计算副总裁透露正在构建一个平台,帮助机器人专家、研究人员、机械工程师和测试人员更轻松地开发机器人解决方案,这无疑会加速人形机器人的发展。
从市场规模来看,麦肯锡报告显示,至2030年,全球人形机器人市场空间可达12 – 16万亿元,潜力巨大。而2025年,或许就是人形机器人量产元年。国外,特斯拉Optimus有望年内进入小批量量产阶段,马斯克更是豪言2026年有望实现大规模量产;国内,智元机器人月初官宣量产的731台人形机器人正式下线,这都预示着人形机器人即将走进我们的生活。
未来,人形机器人有望在更多领域发挥作用,比如在物流领域,它们可以像勤劳的小蜜蜂一样,不知疲倦地搬运货物;在家庭服务领域,它们能成为贴心的小助手,帮忙打扫卫生、照顾老人小孩等。随着技术的不断进步,它们的灵活性、智能性还会不断提升,和人类的协作也会更加默契。
AI眼镜:开启智能穿戴新潮流
2024年年中,Ray – Ban Meta出货量超过100万台,成功点燃了全球AI眼镜赛道。“眼镜一定是承载AI功能的最重要载体之一”已经成为行业共识。就拿CES来说,简直就是AI眼镜的竞技场,据不完全统计,有近50家AI眼镜在现场展示,其中中国玩家至少有14个。
目前已亮相的AI眼镜大致可分为三类:纯音频AI眼镜、音频 + 拍照AI眼镜、带显示AI眼镜。在这场激烈的竞争中,有一款名为Halliday的AI眼镜脱颖而出,吸引了众多目光。Meta一名混合现实产品团队核心成员就表示,被Halliday独特的成像方式所吸引。它没有选择通过各种镜片反射来成像,而是使用DigiWindow显示技术,在镜框上方内侧放置光学模组,把需要从AI获得的信息直接光投影至用户的视网膜成像,就像在眼睛里安装了一个专属的小投影仪,避免了其他AI眼镜的彩虹纹、漏光等问题,还提高了获取信息的效率,和其他AI眼镜打出了差异化。
CES结束后的1个月内,AI眼镜的关注和讨论仍在持续攀升。一方面是展会的强影响力带来长尾效应;另一方面,多个品牌AI眼镜开始发货,用户上手测评反馈不断。Halliday更是在全球最大众筹平台Kickstarter上大放异彩,上线72小时众筹额已超过137万美元(约992.6万元),超募6861%,创史上最大AR/AI眼镜项目众筹纪录。
Halliday有着独特的自我定位,它不把自己当作普通的电子消费品,而是时尚科技品。它首先满足“一副很棒的普通眼镜”的条件,佩戴舒适(35g市场最轻重量 + 超12小时长续航)、时尚好看、可矫正视力(自带免费配镜),然后在此基础上,“只开发在智能眼镜上有意义的功能”。为了不复制手机功能,Halliday主打生产力场景;为了融入用户日常,它还在传统交互形式上增设指环交互形式,不依赖手机,也不用用户在人群中虚空对话,简直是i人的福音。
Halliday背后是中国美瞳一哥,由国内彩瞳品牌moody核心团队孵化和独立运营,公司CEO也是moody创始人、CEO慈然;DigiWindow技术由新加坡AI硬件整合服务商Gyges Labs提供,在Halliday眼镜上搭载了全球最小最轻的近眼显示光学模组。
未来,AI眼镜的功能会更加丰富,或许能像智能助手一样,随时为我们提供信息、辅助我们工作学习;在外观设计上也会更加时尚多样,满足不同人的审美需求;在交互方式上,可能会有更多创新,让我们和AI眼镜的互动更加自然流畅。
智能驾驶:驶向未来出行新征程
在黄仁勋CES演讲的后半段,有一段关于自动驾驶汽车的总结备受热议。他说世界上有三种机器人,其中之一就是自动驾驶汽车,而且它不需要绿地、棕地适应的特性非常完美。
在过去的2024年,智能驾驶领域发生了不少大变化。通过技术架构的端到端,摆脱了高精地图依赖,实现了无图NOA(领航辅助驾驶),就像给汽车装上了更智能的“眼睛”,让它能更好地看清道路;产品体验也实现了端到端,从单城市试点,到全国铺开,再到“车位到车位”,智驾可用范围和时段迅猛增加,让智能驾驶更加实用。
基于这些发展,L2 + 体验不断拔高,行业开始瞄向L3进军,目前也逐渐具备了L3的技术基础、配套政策和保障机制。L3商用有望成为2025年的急先锋,就像冲锋的战士,引领智能驾驶进入新的阶段。
与此同时,作为L4级自动驾驶技术的核心应用场景,Robotaxi也发展得如火如荼。全球一哥Waymo每周载客早已超15万单;国内方面,文远知行、小马智行相继敲钟上市。马斯克还预判,Robotaxi的每公里运营成本将低于1元,7 * 24小时全天候运营的Robotaxi,在全球范围内商业化正火线提速。根据量子位智库基于公开数据测算,2025年,国内Robotaxi市场规模就将达到10.92亿元。
未来,智能驾驶技术会更加成熟,交通事故可能会大幅减少,出行会更加安全、高效;Robotaxi可能会成为城市交通的重要组成部分,改变我们的出行方式,让打车变得更加便捷、便宜。
AI陪伴:从虚拟走向现实的温暖陪伴
AI陪伴一直是众多公司布局AI Native应用的重要选择。据量子位智库报告调研,过去一年中,国内有20家公司共推出了21款产品。但2024年,国内AI陪伴的新增速度和用户活跃等数据普遍下滑,有点后继乏力。这可能是市场趋于饱和、用户需求变化以及技术创新不足等因素导致的。
不过CES让AI陪伴迎来了新的转机,人们发现AI陪伴开始从线上向线下转移,各式各样的AI玩具出现了,比如Moflin、Mirumi、Nékojita FuFu、Ropet、Ai Me等。这些AI玩具通过AI技术,能根据环境进行感知,有的具备情感模拟能力,虽然有的还无法与人类进行深度交互,但它们已经有成为热门潮玩的趋势。
它们受欢迎的根本原因,在于能提供新鲜体验和情感支持,而且作为AI陪伴的物理世界载体,不再只盯着儿童用户做“陪伴”,而是扩展到多年龄段用户。就像一个温暖的小太阳,照亮了不同年龄段用户的生活。
2025年,线上增长放缓的AI陪伴,正在从虚拟应用向实体硬件转型,产品设计趋向于更加拟人化和情感化,以满足用户对陪伴和互动的需求。未来,AI陪伴产品可能会更加懂我们的心思,在我们开心时陪我们欢笑,在我们难过时给予安慰,成为我们生活中不可或缺的伙伴。
技术侧
Inference – Scaling:开启大模型推理新时代
2025年技术侧有一个重要趋势,那就是因OpenAI o1掀起的Scaling新范式:Inference – Scaling。与1年前技术领域普遍信仰的传统Scaling Law不同,Inference – Scaling强调了后训练(post – training)和推理阶段(inference – time)计算投入的重要性,就像给大模型推理能力的提升找到了新的“燃料”,模型推理能力得到大幅提升。
这意味着大模型资源开始向Post – training和推理算力倾斜,也意味着新一轮竞赛的开始。单看国内,短短几个月内已经有昆仑万维Skywork o1、阿里通义QVQ、智谱华章GLM – Zero – Preview、阶跃星辰Step R – mini、深度求索DeepSeek – R1、月之暗面Kimi k1.5、百川智能Baichuan – M1 – preview等多个推理模型问世。
OpenAI CEO山姆·奥特曼非常明确地对外宣称,“o1只是推理模型的GPT – 2时刻”。事实也确实如此,从推理能力上来说,谷歌版o1,即Gemini 2.0 Flash Thinking,思考速度比(发布时市面上)所有模型快5倍;OpenAI较o1成立提升不止一倍的o3系列中,mini已可使用。从泛化能力上来说,inference – Scaling并非只在语言大模型领域生效,o3、QVQ、Baichuan – M1 – preview等都证明其可以泛化至视觉领域。从模型成本上来说,DeepSeek – R1在训练层面的创新与工程优化,又将推理模型的天价成本和使用费用拉到了新低,持续震撼硅谷。
英伟达12月底发布的全新GPU B300,显存从192GB提升到288GB,足以支持推理模型在处理长序列任务时,其KVCache机制能够显著降低延迟,并支持更大的batch size,为推理模型提供了强大的物理外援。
未来,Inference – Scaling技术会不断发展,模型的推理能力和泛化能力会进一步提升,成本也会不断降低,让更多的应用场景能够受益于大模型的推理能力,比如在智能客服领域,能更准确、快速地回答用户问题;在智能医疗领域,辅助医生进行更精准的诊断。
视频生成:技术飞跃,创意无限
自去年2月OpenAI推出Sora模型引爆视频生成领域以来,全球范围内的相关技术突飞猛进。在本轮视频生成技术进步热潮中,有两股技术力量最受瞩目。
其一是将Transformer架构引入到扩散模型中的DiT(Diffusion Transformer)模型,它就像给视频生成质量装上了一个强力助推器,极大地提高了图像生成的质量,OpenAI的Sora就是代表作,它生成的东京女郎等视频让人眼前一亮。
另一种主要路线仍然与深度学习和GAN(生成式对抗网络)密不可分,它通过分析大量训练数据,学习并尝试模拟现实世界的物理规律,Google DeepMind的Veo 2就是代表,它生成的切番茄等视频展示了其强大的能力。
在这条赛道上,国内相比海外更加百花齐放,创业公司和大厂各显其能。创业玩家有海螺(MiniMax)、清影(智谱)、跃问视频(阶跃)、Vidu(生数)、PixVerse(爱诗);大厂玩家有可灵(快手)、即梦(字节)、万相(阿里)、混元(腾讯)、SkyReels(昆仑万维)。国内视频生成赛道玩家几乎都走「左手技术推进,右手产品落地」路线,toC产品用户市场反馈对技术的倒逼,也成为视频生成技术迫切前进乃至革新的重要要素。
未来,视频生成技术会更加智能,能根据我们的简单描述生成高质量的视频,可能会改变影视制作、广告创意等行业的工作方式,让创作变得更加高效、有趣。
AI Coding:编程新助手,开发新变革
传统AI Coding,如GitHub Copilot,底层接入OpenAI的Codex模型,主要聚焦于单行代码补全或函数生成,就像一个小助手,只能帮忙做一些简单的代码工作。
而新一代AI Coding工具,借助GPT – 4o、Claude 3.5等AI 2.0时代的大模型,实现了全栈开发能力。尤其是Claude 3.5 Sonnet强大的编程能力,催生了很多AI Coding明星项目,如Windsurf、Bolt、V0,还有刚刚官宣完成最新1.05亿美元B轮融资的Cursor,它在去年年中接入Claude 3.5 Sonnet后,实现了用户量和口碑双双爆发。
除了指令微调、代码专项微调、多任务学习与多目标损失函数等拉升AI Coding能力的传统方法外,Claude 3.5 Sonnet的强代码能力,还有部分来自于其长上下文能力,有助于模型评估需求并生成量身定制的解决方案。
2025年,AI Coding背后的技术又有了新的探索点。代码能力与o1相当且开源的Deepseek – R1,本月20日刚刚发布。其AI Coding能力能大幅提升,部分基于在极少数标注数据的情况下,后训练阶段纯RL(强化学习)路线,无需SFT(监督式微调);在编程任务中,额外使用自动化测试来评估代码质量。
AI Coding已经完成颠覆性变革,从代码补全工具跃升为全流程开发助手,甚至已经从“低代码”的拖拉拽,进阶到让“无代码”编程从概念走向实践。目前,AI Coding的底层技术已经出现值得深入探索的新侧重点,加上基座大模型自身的飞速进展,完全有望在2025实现智能驾驶L3级别的突破,催生出全新的开发范式。
未来,AI Coding可能会让编程变得更加简单、高效,即使是没有编程基础的人,也能通过它轻松开发出自己想要的应用程序,大大降低编程门槛,促进软件行业的发展。
空间智能:构建虚拟与现实的桥梁
空间智能这一概念,最早在2024年由被誉为“AI教母”的斯坦福大学教授李飞飞提出,她就像一位智慧的开拓者,为我们打开了空间智能的大门。空间智能是指机器在三维空间和时间中感知、推理和行动的能力,帮助它理解事物在三维空间中的位置及交互方式。
遵循此理念,李飞飞创办了空间智能公司World Labs,并于去年12月初发布了首个空间智能模型,1张图就能生成可交互的3D游戏世界AI系统,真正拉开了空间智能从理论迈向实践的帷幕。
空间智能的野望在于将空间计算操控虚拟世界的本领和具身智能触达现实世界的能力结合起来。所以,具身智能、世界模型、3D生成也可涵盖在广义空间智能背后技术范围内。
其中,世界模型旨在构建对物理世界的动态模拟,支持AI系统预测未来状态并制定行动策略。截至目前,该领域呈现两大技术路线:第一,以谷歌Genie 2为代表,通过视频生成模型学习物理规律,能够从单帧图像预测连续动作序列;第二,以英伟达Cosmos为代表,结合强化学习与多模态数据,构建高精度虚拟环境。
3D生成技术则是空间智能的另一个发展方向,其下又分基于3D Gaussian Splatting、利用2D Diffusion Model优化3D几何、通过Transformer直接映射2D图像到3D表征等多种技术路线。
未来,空间智能可能会在游戏、教育、建筑等领域得到广泛应用。在游戏中,能创造出更加逼真、沉浸式的游戏环境;在教育领域,能让学生更直观地学习知识;在建筑领域,能帮助设计师更高效地设计和展示建筑方案。
这8大赛道,有的蓄势待发,有的已露峥嵘,AI正以前所未有的速度重塑着我们的生活。你对这些AI热门赛道有什么看法和期待呢?欢迎在评论区留言讨论,一起分享你对AI未来的畅想!