![阶跃星辰 年末AI圈惊现黑马,凭啥获国资青睐?](https://aimgsgoheap.codexiu.cn/2024/12/image-2024-12-26-阶跃星辰-.webp)
阶跃星辰
年末AI圈惊现黑马,凭啥获国资青睐?
在AI领域,本以为OpenAI直播已然是2024年的尾声,没想到临近年底,国内AI圈却爆出大新闻。国产AI六小虎中的阶跃星辰,就在前几天,成功拿到了数亿美元的融资,这一消息瞬间在圈内引起轩然大波。而且值得关注的是,投资方里出现了上海国资的身影。就在此前没几天,北京国资也刚刚投资了六小虎中的另一家——智谱,这一南一北两大超级城市,各自押宝,仿佛拉开了大模型版的“沪爷VS京爷”的大幕。
01
要说这阶跃星辰,在不少网友眼中可能有点陌生,毕竟它是六小虎里最后登场的。但在业内,它其实早就声名远扬,只是行事极为低调罢了。它登场之时,已然是独角兽般的存在。就拿模型发布来说,它主打速度快、效率高,短短10个月内就发布了11款模型,在16个月内,更是打造出了从理解到生成的全系列模型矩阵,甚至首秀就亮出了对标GPT-4的万亿参数模型。
在大模型领域,如今已然在缩决赛圈儿了,判断一家公司有无冠军相,业内人士往往从两个关键角度出发,一是有没有顶尖人才,二是能不能持续投入技术研发搞AGI。先说说人才这方面,大模型的人才圈子,可能比我们想象的还要小。就拿今年诺奖得主乔弗里·辛顿来说,他那被誉为“顶级宗门”的实验室,培养出了众多行业大佬。像OpenAI联合创始人伊利亚是他的博士;谷歌DeepMind的大佬阿列克谢是他的博士后;Meta的人工智能负责人杨立昆也是他的弟子;前百度首席科学家吴恩达,同样和他渊源颇深。
在国内,被北京国资选中的智谱AI,出身于有着27年人工智能研究历史的清华大学知识工程实验室,学术背景相当深厚。而这次的阶跃星辰,能被资本看好,和其强大的人才阵容脱不了干系。与学院派的智谱不同,阶跃星辰有着自己的特色,其团队里很多成员都是行业内的“老人”了。例如其创始人、CEO姜大昕,曾经可是微软前全球副总裁,参与过日活上亿、备受欢迎的Bing搜索,以及全球最早的智能个人助理Cortana等项目,是他将深度学习技术应用到Bing上,助力Bing搜索服务拓展到全球超200个国家和地区。
再看阶跃星辰的首席科学家张祥雨,他本是西交与微软亚洲研究院的博士生,师从孙剑和何恺明,还是开山大弟子。在他读博期间,师门四人共同完成了ResNet(残差学习)这篇引用次数高达几十万、在本世纪深度学习领域极为著名的论文,张祥雨负责了底层框架和编码。这篇论文的核心思想残差网络,对现代深度学习影响巨大,当年打败八冠王捷豹的AlphaGo系列,就运用了ResNet技术,如今在Transformer网络(GPT里那个T)中,同样也有它的身影。除此之外,苹果的3D人脸解锁,也就是FaceID,也是受他的ShuffleNet技术影响才得以问世。从这样的人才实力来看,阶跃星辰能获得魔都的投资,也就不足为奇了。
02
![年末AI圈惊现黑马,凭啥获国资青睐?](https://aimgsgoheap.codexiu.cn/2024/12/image-2024-12-26-跃问视频-.webp)
除了人才,大模型厂商路线的选择也越发受到重视,AGI基座模型方向,无疑是技术理想主义者们最热衷的方向,也是众多创业者入局大模型领域的初心所在。基座大模型就如同大厦的地基,只有地基稳固了,模型的基础能力不断提升,未来才有可能打造出真正理解世界的通用模型,并应用到各个场景去改变人们的生活。像OpenAI、Google、Anthropic、Meta,以及国内的智谱、阶跃星辰等,都在坚持推出各类AI应用的同时,在基座大模型的探索道路上坚定前行。
不过,由于整个AI领域降温,不少初创厂商因成本压力,搁置了基座大模型的研究,将重心转向AI应用,要么投身垂直行业赛道,要么单纯做toC生意来维持生计。但在2024年,国内依旧不断更新基座模型,始终在公开场合重申AGI为最终目标的公司里,智谱和阶跃星辰堪称典型代表。几个月前,张鹏就明确表示,他们的目标就是AGI,每一个相关问题的突破都可能带来飞跃式发展。阶跃星辰也是如此,其创始人姜大昕坦言,高昂的训练成本确实是个挑战,就像业内调侃的“讲卡伤感情,没卡没感情,用卡费脑筋”,可既然追求的是AGI,即便付出再多也要坚持下去。姜大昕为阶跃星辰规划的技术路线分为“单模态 – 多模态 – 多模理解和生成 – 世界模型 – AGI”这五个步骤,这或许就是阶跃的大模型系列被命名为Step的缘由所在。
03
![年末AI圈惊现黑马,凭啥获国资青睐?](https://ai.codexiu.cn/wp-content/uploads/2024/12/image-2024-12-26-step2-万亿参数moe.webp)
在有着图灵奖得主杨立昆亲推,且有着“全球最难大模型评测”之称的LiveBench权威榜单上,Step-2拿下了国内第一、总榜第五的优异成绩,成为唯一进入前十名的中国语言大模型。
而阶跃星辰的“第二步”Step-1V同样表现出色,从大模型竞技场Chatbot Arena的数据来看,在这个网友们可以试用所有大模型并打分的网站上,今年11月的榜单里Step-1V的总分已经达到了Gemini1.5的水平。不仅如此,在C端应用方面,阶跃星辰也打造出了不少出圈产品。比如主打拍照识别的跃问app,它可是最早接入iPhone 16相机控制的国产大模型功能应用;还有一上线就迅速冲上App Store美食榜前三的胃之书,正是运用了阶跃的多模态大模型;今年在圈内爆红的AI小游戏换你来当爹、灵魂提取器,也都是基于阶跃星辰的模型能力开发出来的。
在AI领域逐渐降温的2024年末,智谱和阶跃星辰先后获得国家队的投资,这对于国产AI行业而言,无疑是一个极为重要的信号。一方面,意味着行业内的发展方向越发清晰,国家队层面也迫切希望早日看到AGI的实现;另一方面,这也可以说是拉开了国内大模型下半场的序幕,只有拥有优秀人才、找准发展方向并且能坚持到底的企业,才有机会朝着人工智能的终极目标——AGI进军。