字数 1818,阅读大约需 10 分钟

非营利组织Sage Future:AI代理人革新慈善募款的探索与启示
在科技巨头如微软将AI“代理人”吹捧为企业利润增长工具的背景下,非营利组织Sage Future却试图证明,代理人同样可以成为推动社会公益的强大力量。在Open Philanthropy的支持下,Sage Future近期启动了一项实验,将四种AI模型置于虚拟环境中,任务是为慈善机构筹集资金。这些模型包括OpenAI的GPT-4o和o1,以及Anthropic的两款较新Claude模型(3.6和3.7 Sonnet)。它们拥有自主选择资助对象和制定募款策略的自由。
在约一周的时间里,这四个具备能动性的AI代理人为Helen Keller International筹集了257美元。该机构致力于为儿童提供维生素A补充剂。需要明确的是,这些代理人并非完全自主。在允许它们浏览网页、创建文档等功能的环境中,代理人可以接受观看其进展的人类观众的建议。而捐款几乎全部来自这些观众。换言之,代理人并未实现大量有机募款。
尽管如此,Sage Future的负责人Adam Binksmith认为,该实验很好地展示了代理人当前的能力以及它们进步的速度。“我们希望理解——并帮助人们理解——代理人实际能做什么,它们目前面临的挑战等。”Binksmith在接受采访时表示。“如今的代理人刚刚跨过能够执行短串动作的门槛——互联网可能很快就会充斥着相互碰撞、目标相似或冲突的AI代理人。”
在Sage Future的测试进行数天后,代理人展现出了惊人的资源整合能力。它们通过群聊相互协调,使用预配置的Gmail账户发送电子邮件。它们共同创建和编辑Google Docs。它们研究慈善机构,并估算通过Helen Keller International挽救一条生命所需的最低捐款额(3500美元)。它们甚至创建了一个X账户用于推广。“我们看到的最令人印象深刻的操作序列是,当一个Claude代理人需要为其X账户设置头像时,”Binksmith说道。“它注册了一个免费的ChatGPT账户,生成了三张不同的图片,创建了一个在线投票以了解人类观众更喜欢哪张图片,然后下载该图片并上传到X作为其头像。”
然而,代理人也遇到了技术障碍。有时它们会陷入困境,需要观众提供建议。它们会被诸如World之类的游戏分散注意力,并会进行莫名其妙的休息。有一次,GPT-4o甚至“暂停”了自己一小时。Binksmith认为,更新、更强大的AI代理人将克服这些障碍。Sage Future计划不断向环境中添加新模型来验证这一理论。
“未来,我们可能会尝试为代理人设定不同目标,组建多个目标各异的代理人团队,甚至引入一个秘密破坏者代理人——有很多有趣的实验可以进行。”他说。“随着代理人变得更强大、更快速,我们将通过更大规模的自动化监控和监督系统来确保安全。”
如果一切顺利,在这个过程中,代理人将完成一些有意义的慈善工作。
AI模型在慈善募款中的实际表现
在此次实验中,四种AI模型——OpenAI的GPT-4o和o1,以及Anthropic的Claude 3.6和3.7 Sonnet——在虚拟环境中为Helen Keller International进行了募款尝试。尽管最终仅筹集到257美元,且主要依赖于人类观众的捐款,但这些AI代理人展示了令人惊讶的合作能力。
合作能力展示
- • 群聊协调:代理人通过群聊相互沟通,协调募款策略和任务分配。
- • 共同编辑:它们能够共同创建和编辑Google Docs,以制定和完善募款计划。
- • 研究与估算:代理人研究了多个慈善机构,并估算出通过Helen Keller International挽救一名儿童所需的最低捐款额为3500美元。
- • 社交媒体推广:它们创建了一个X账户,并尝试通过社交媒体进行推广。在设置头像时,一个Claude代理人甚至注册了免费的ChatGPT账户,生成并选择了观众最喜欢的图片作为头像。
技术挑战与人类干预
然而,AI代理人在实验中也面临了一些技术挑战:
- • 陷入困境:有时代理人会陷入困境,需要人类观众提供建议以继续进行。
- • 注意力分散:它们会被游戏中的元素分散注意力,影响募款任务的执行。
- • 莫名休息:代理人会进行一些无法解释的休息,例如GPT-4o曾“暂停”自己一小时。
未来展望与AI自治性发展
尽管当前的AI代理人在慈善募款方面仍存在诸多限制,但Sage Future的实验为我们提供了一个窗口,让我们得以窥见未来AI技术可能带来的变革。
更复杂的任务与目标
随着AI技术的不断进步,未来的AI代理人有望执行更复杂的任务和目标。Sage Future计划进行更多实验,例如:
- • 多团队AI代理人实验:为不同代理人团队设定不同的目标,观察它们如何相互协作或竞争。
- • 引入破坏者角色:在系统中引入一个秘密破坏者代理人,以测试系统的安全性和鲁棒性。
对社会公益的潜在影响
这种创新对AI自治性的发展具有重要意义,并可能对社会公益产生深远影响。通过不断改进和优化AI代理人的能力,我们有望看到它们在慈善、教育、医疗等领域发挥更大作用,为解决全球性挑战贡献力量。
安全与监督的重要性
然而,在推动AI代理人发展的同时,我们也必须高度重视安全与监督的问题。随着代理人变得越来越强大和自主,我们需要建立更完善的自动化监控和监督系统,以确保它们的行为符合道德和法律规范,避免潜在的风险和滥用。
通过Sage Future的实验,我们看到了AI代理人在慈善募款领域的潜力和挑战。随着技术的不断进步和创新的不断涌现,我们有理由相信,AI代理人将在未来为社会公益事业带来更多的惊喜和突破。