Coval:以自动驾驶之法评估AI语音与聊天代理

字数 830,阅读大约需 5 分钟

Coval:以自动驾驶之法评估AI语音与聊天代理
AI语音和聊天代理coval

Coval:以自动驾驶之法评估AI语音与聊天代理

AI语音代理和自动驾驶汽车看似风马牛不相及,实则在性能评估上有着异曲同工之妙。前Waymo技术负责人Brooke Hopkins创立的Coval公司,正致力于此。

Hopkins在离开Waymo后,敏锐地察觉到Waymo曾面临的诸多问题,同样困扰着整个AI行业。当时,业内普遍认为AI领域需全新的测试实践,一切要从零开始。然而,Hopkins却认为,过去十年在自动驾驶领域积累的经验,完全可以应用到AI语音和聊天代理的评估上。

于是,在2024年,Hopkins毅然推出了Coval平台。该平台为AI语音和聊天代理构建模拟场景,其测试和评估方式,与Hopkins在Waymo测试自动驾驶汽车如出一辙。Coval能够同时运行数千个模拟场景,例如模拟让代理进行餐厅预订,或是以间接方式回应客户服务问题。它不仅能依据一套通用指标评估代理,企业还能按需定制评估标准,并利用Coval持续监测是否出现性能倒退。用户可以将这些数据及从中获得的洞察,展示给终端客户,既可以作为产品演示,也能作为监测工具,向客户证明代理正按预期运行。

Coval理念的形成并非一蹴而就。早在2024年夏季Y Combinator孵化期间,Hopkins就已初步构思出Coval的理念,并于同年10月正式推出产品。自推出后,市场需求强劲,尤其是在过去两个月,需求更是呈爆发式增长,众多客户纷纷咨询评估代理的时间。

如今,这家位于旧金山的初创公司已成功宣布完成330万美元的种子轮融资,此轮融资由MaC Venture Capital领投,Y Combinator和General Catalyst参投。Coval计划利用这笔资金扩充工程团队,实现产品与市场的完美契合。Hopkins还透露,未来Coval将致力于支持用户评估其他类型的AI代理,如基于网页的代理。

当下,AI代理领域正处于发展的热潮,势头迅猛且备受瞩目。企业技术领袖如Marc Benioff就曾大力称赞并推广相关技术,宣称Salesforce明年将部署超10亿个AI代理。OpenAI也传闻即将推出自家的AI代理产品。此外,众多初创公司也纷纷涌入该领域,仅Y Combinator在2024年的三个批次中,就有超100家初创公司投身于AI代理的开发。部分AI代理初创公司更是斩获巨额风险投资,例如/dev/agents在2024年11月成立不到一年,就以5亿美元估值完成5500万美元的种子轮融资。

在这股热潮中,Coval有望凭借自身优势脱颖而出。Hopkins表示:“我们的优势在于,我在这个领域已深耕五年,反复构建过相关系统。我们经历过多次迭代,深知系统的成败与规模扩展之道,并将这些经验融入到Coval中。”

© 版权声明

相关文章

暂无评论

暂无评论...