字数 1032,阅读大约需 6 分钟

出门问问发布小问移动数字人 完美适配各种场景
产品亮点与技术革新
在全球开发者先锋大会(GDC)上,出门问问公司推出了小问移动数字人,成为现场焦点。
灵活可移动的身体
小问移动数字人基于DeepSeek和自研大模型「序列猴子」设计,具备灵活移动能力,适应各种场景。
高智商的问答能力
配备高智商“大脑”,能快速搜索并回答用户问题,胜任AI讲解员、接待员或导游角色。
流畅的交互体验
采用前沿的大模型声音克隆技术,3秒完成声音克隆,提供丰富听觉体验。支持多国语言,交互自然流畅。
技术上的创新
实现边缘计算技术,将数字人本地渲染、麦克风阵列算法等融合,实现高效端侧渲染和低延迟交互。支持多模态数字人交互,包括2.5D、3D和照片数字人,提供多样化体验。
小问移动数字人应用广泛,可为展厅、博物馆提供讲解导览,为企业、政府、机场提供咨询和接待导引,为游客提供路线规划与实时信息服务。出门问问将持续提升产品智能水平和交互体验,并拓展应用场景。
根据《2023年人工智能发展报告》,AI技术在边缘计算和多模态交互领域的突破,将推动具身智能产品在各行业的应用。小问移动数字人作为该领域的创新产品,有望在未来市场中占据重要地位。
广泛的应用场景
小问移动数字人不仅能胜任AI讲解员的角色,在展厅、博物馆等文化场所提供详尽的讲解导览服务,还能作为AI接待员,为企业、政府、机场等提供高效的咨询服务和日常接待导引。此外,小问移动数字人还具备AI导游的功能,能为游客提供精准的路线规划与实时信息服务。这些多样化的应用场景,不仅展示了小问移动数字人在降本增效方面的潜力,也凸显了其在提升用户体验方面的优势。
技术革新与未来发展方向
小问移动数字人采用了边缘计算技术,将数字人本地渲染、麦克风阵列算法、本地视觉算法等端侧AI技术融合,实现了高效的端侧渲染和低延迟交互。同时,小问移动数字人还支持多模态数字人交互,包括2.5D数字人、3D数字人、照片数字人等,为用户提供了丰富的数字人体验。在声音方面,小问移动数字人采用了行业前沿的大模型声音克隆技术,仅需3秒即可完成声音克隆,并拥有海量AI声音库,支持多国语言选择,为用户提供了多样化的听觉体验。
出门问问公司表示将继续深耕多模态大模型技术,不断提升小问移动数字人的智能水平和交互体验。同时,公司也将积极拓展应用场景,推动小问移动数字人在更多领域发挥重要作用。
行业影响与前景展望
小问移动数字人的推出,代表了出门问问公司在AI技术领域的深厚实力。根据《2023年全球人工智能市场报告》,预计到2025年,全球具身智能市场规模将达到1000亿美元。小问移动数字人作为这一领域的先驱产品,有望在市场中占据重要地位。