字数 1252,阅读大约需 7 分钟
Composo助力企业监测AI应用效能
在当今科技领域,人工智能(AI)及其驱动的大语言模型(LLMs)展现出诸多实用价值,但可靠性问题一直困扰着行业发展。在此背景下,总部位于伦敦的初创公司Composo脱颖而出,致力于帮助企业确保基于LLM的应用程序按预期运行。
Composo的独特优势
Composo在解决AI应用可靠性问题上具备先发优势。它通过定制模型,助力企业评估基于LLM应用程序的准确性与质量。市场上虽有类似公司如Agenta、Freeplay、Humanloop和LangSmith等试图提供基于LLM的解决方案替代传统测试工具,但Composo与众不同之处在于同时提供无代码选项和API。这使得领域专家和企业高管无需专业开发人员,就能自行评估AI应用的一致性、质量和准确性,极大拓宽了潜在市场范围。
从技术实现看,Composo将基于人们期望从AI应用获得的输出训练而成的奖励模型,与特定应用程序定义的一组标准相结合,创建出能根据这些标准评估应用程序输出的系统。例如,对于医疗分诊聊天机器人,客户可设置自定义指南检查危险信号症状,Composo能对该应用程序执行此操作的一致性进行评分。
市场表现与资金支持
近期,Composo推出用于Composo Align的公共API,这是一个可基于任何标准评估LLM应用程序的模型。这一策略初显成效,埃森哲(Accenture)、帕兰提尔(Palantir)和麦肯锡(McKinsey)等知名企业已成为其客户。并且,Composo成功筹集了200万美元的种子前轮资金。
Composo联合创始人兼首席执行官塞巴斯蒂安·福克斯(Sebastian Fox)解释,相对较低的融资金额是因为公司发展模式并非资本密集型。曾担任麦肯锡顾问的福克斯表示,至少在未来三年内,公司预计不会筹集数亿美元,因为已有许多人在基础模型构建方面做得很好,而这并非公司独特卖点。相反,OpenAI在其模型上取得重大进展对公司业务有益。
有了这笔新资金,Composo计划扩充由联合创始人兼首席技术官卢克·马卡姆(Luke Markham)领导的工程团队(卢克·马卡姆曾是Graphcore的机器学习工程师),争取更多客户,并加大研发投入。福克斯称,从今年开始,公司重点将更多放在把现有技术推广至更多公司。
此次种子前轮融资由英国AI种子前基金Twin Path Ventures领投,JVH Ventures和EWOR也参与其中(EWOR此前通过其加速器计划对该初创公司进行了支持)。Twin Path的一位发言人表示:“Composo正在解决企业AI应用中的一个关键瓶颈问题。”
解决行业关键瓶颈
福克斯指出,企业对AI可靠性的担忧是整个AI行业尤其是企业领域的重大问题。人们不再盲目热衷AI热潮,而是思考AI能否给业务带来改变,因其不够可靠稳定,且无法证明改善程度。这一瓶颈使得Composo对希望实施AI又担心声誉风险的公司更具价值。
福克斯表示,这就是Composo选择不局限于特定行业,在合规、法律、医疗和安全等领域都具有适用性的原因。至于竞争壁垒,福克斯认为实现当前成果所需的研发并非易事,涉及模型架构以及训练数据。Composo Align是基于“大量专家评估数据集”进行训练的。
尽管可能有科技巨头凭借雄厚资金涉足该领域,但Composo认为自身具有先发优势。福克斯提到,另一个关键因素是公司随着时间积累的数据,即Composo构建评估偏好的方式。由于它能根据灵活标准评估应用程序,相较于采用更受限方法的竞争对手,Composo认为自己更适合应对代理AI的兴起。
相关行业报告显示,在企业AI应用市场中,70%的企业表示在使用AI应用时遇到过可靠性和稳定性问题,凸显了Composo这类解决方案的重要性。目前企业AI应用监测领域处于发展初期,众多初创企业竞争激烈。Composo凭借独特技术和市场策略,有望在市场竞争中占据一席之地。