2024年,AI领域出现了一些奇特的基准测试,其中最引人注目的当属“威尔·史密斯吃意大利面”。当新的AI视频生成器问世,人们总会用它生成威尔·史密斯狼吞虎咽吃面的搞笑视频,这一现象不仅成为了热门的网络梗,还意外地演变成了评估新AI工具表现的非官方标准。
今年2月,威尔·史密斯本人也通过Instagram发布了一段模仿吃面的搞笑视频,亲身助力热潮的传播。除了威尔·史密斯吃意大利面,还有16岁开发者创建的让AI控制《我的世界》并测试其建筑设计能力的应用,以及英国程序员创建的让AI玩“你画我猜”和“四子棋”等游戏的平台。
传统的AI基准测试,如企业常引用的AI在数学竞赛或解决博士级问题上的能力,对于普通用户来说过于复杂和遥远,而像“聊天机器人竞技场”这样的公共基准测试平台,参与者多为科技行业人士,评分也缺乏代表性。相比之下,这些奇特的测试因其趣味性和易理解性而备受欢迎。
然而,这些奇特的基准测试也存在局限性,一个能完美生成威尔·史密斯吃意大利面视频的AI,未必能很好地生成其他图像。尽管如此,它们在短期内可能不会消失,因为它们不仅娱乐性十足,而且易于理解,非常适合大众传播。
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...