字数 1347,阅读大约需 7 分钟
小米大模型团队双双入选国际顶级AI会议,小爱功能再升级
近日,小米公司传来令人瞩目的消息:小米大模型团队的两篇论文成功入选2025年北美计算语言学协会(NAACL[1])会议,且均被列为主会长文。这一成果彰显了小米在人工智能领域的深厚技术积累,标志着其在AI技术应用方面快速迈进。
北美计算语言学协会(NAACL)会议是自然语言处理领域的国际顶级学术会议,在全球声誉极高。该会议每年收到大量论文投稿,最终录用率较低,入选主会长文更是难能可贵。此次小米大模型团队两篇论文同时入选,证明其在人工智能领域的研究实力获国际顶尖学术机构高度认可。
这两篇论文分别聚焦图形用户界面(GUI)代理和机器翻译方向。
图形用户界面(GUI)代理方面的创新
小米团队进行了创新性研究,将手机控制任务细分为页面到达和页面操作两个子任务。传统智能代理处理手机控制任务时,常陷入局部最优解困境,导致整体任务执行效率不高。而小米团队这种细分方式,打破只追求每一步最优解的局限,使智能代理更专注于整体任务的完成能力。
从编程角度看,以Python语言为例,传统方式处理模拟手机操作任务代码,可能按固定顺序执行每一步操作。小米团队的方法类似在代码中添加更智能的任务调度机制,能根据整体任务目标动态调整操作顺序,提升智能助手效率,让用户使用手机体验更流畅。
机器翻译领域的显著成果
小米团队在机器翻译领域也取得显著成果。他们基于大型语言模型深入研究,探索出多语言翻译的最佳训练范式,并开源一系列翻译模型。这些成果已在小爱翻译中实际应用,为用户带来便利。
随着全球化推进,多语言翻译需求日益增长。小米小爱翻译多语言能力的提升,满足了市场需求。用户观看无字幕外语视频或浏览外文网页时,借助小爱翻译可打破语言障碍。
从技术实现角度,小米团队在大型语言模型基础上优化翻译算法。在深度学习框架如TensorFlow或PyTorch中,训练翻译模型需大量语料数据和复杂参数调整。小米团队通过探索最佳训练范式,采用迁移学习技术,利用已有大规模预训练模型,在少量特定领域语料上微调,提高模型训练效率和翻译准确性,提升翻译模型在不同语言对之间的翻译质量。
小米表示,这次研究成果的发布,是其深耕底层技术、长期持续投入的典范。小爱翻译的多语言能力,不仅对小米用户有益,也展现了小米在全球科技竞争中的实力与前瞻性。
放眼全球人工智能领域,各大科技巨头不断加大对AI技术投入。2025年,Meta、亚马逊、谷歌母公司Alphabet和微软联合投入3200亿美元,专注AI技术研发和数据中心建设,较2024年的2300亿美元显著上升,显示AI领域竞争日益激烈。在这样的环境下,小米能在国际顶级AI会议上崭露头角,技术实力不容小觑。
在韩国,云计算行业因生成性人工智能的普及以及云服务使用率的提升,2023年行业收入达到7.39万亿韩元,较上一年增长26.6%。这表明人工智能技术在各领域的应用推动着行业快速发展。小米在人工智能领域的持续投入与创新,顺应了全球科技发展趋势。
小米在人工智能领域的成功为其他企业提供借鉴。在人工智能领域,持续技术研发投入、对细分领域深入研究以及将技术成果快速应用到产品中的能力,是企业在激烈竞争中脱颖而出的关键。同时,开源相关技术成果,有助于推动整个行业发展,提升企业在行业内的影响力。小米在机器翻译领域开源一系列翻译模型,就体现了这方面积极作用。