字数 1156,阅读大约需 6 分钟

Devin:AI编程工具的革新与挑战
Devin,这款由Cognition推出的AI编程工具,自去年发布以来便在社交媒体上迅速走红。其自主执行软件开发任务的能力令人瞩目,然而在处理复杂编码工作时却面临挑战。近期,Cognition推出了一种新的按需付费模式,入门级选项仅需20美元,但根据使用方式的不同,最终费用可能相当昂贵。此外,Cognition声称Devin 2.0相较于去年12月的版本有了显著改进,能够帮助生成编码项目的计划、回答有关代码的问题并创建带文档的‘wiki’。
Devin的崛起与挑战
社交媒体走红
Devin的发布在社交媒体上引起了巨大轰动,其自主执行软件开发任务的能力令人惊叹。AI创始人,包括Perplexity CEO Aravind Srinivas,对Devin给予了高度评价,这显著提升了Cognition的知名度[1]。
复杂编码工作的挑战
然而,Devin在处理更复杂的编码工作时遇到了困难。这一局限性在实际应用中逐渐显现,引发了业界对其能力的质疑。
新定价策略的推出
入门级选项与按需付费模式
为了吸引更多用户,Cognition推出了入门级选项,价格仅为20美元,并过渡到按使用量计费的模式。然而,这种模式的最终费用可能因使用方式而异,对于处理大规模代码库的用户来说,费用可能相当高昂。
计算信用(ACUs)的概念
Cognition引入了计算信用(ACUs)的概念,用于衡量Devin的使用量。在20美元的入门级选项中,用户可获得约9个ACUs。然而,根据Cognition的说法,15分钟的“active Devin work”仅相当于约1个ACU,这意味着9个ACUs只能提供约2.25小时的工作时间,对于处理大规模代码库来说远远不够。
Devin 2.0的技术改进
新功能的引入
Cognition声称Devin 2.0相较于去年12月的版本有了显著改进。类似于GitHub的Copilot工具,Devin现在能够帮助生成编码项目的计划,回答有关代码的问题并创建带文档的‘wiki’。
效率的提升
Devin的开发团队成员Silas Alberti表示,新版本的工具现在能够完成之前两倍的工作量。然而,这一说法需要持保留态度,因为即使是最优秀的代码生成AI也可能引入安全漏洞和错误。
AI编程工具的局限性与潜在风险
安全漏洞和错误的引入
研究表明,即使是最先进的代码生成AI也可能引入安全漏洞和错误,这主要是由于它们在理解编程逻辑等方面的能力不足。对Devin的 recent evaluation发现,它仅成功完成了20个任务中的3个。
实际应用中的挑战
AI编程工具在实际应用中面临诸多挑战,包括对复杂编码工作的处理能力、安全漏洞和错误的引入以及使用成本等问题。这些挑战限制了AI编程工具的广泛应用,并引发了对其可靠性和实用性的质疑。
结论
Devin作为一款备受瞩目的AI编程工具,其新定价策略和技术改进引发了业界的广泛关注。然而,AI编程工具在实际应用中仍面临诸多挑战和潜在风险。随着技术的不断发展和完善,我们期待AI编程工具能够克服这些挑战,为软件开发领域带来更多的创新和突破。