📢 Gate广场独家活动: #PUBLIC创作大赛# 正式开启!
参与 Gate Launchpool 第 297 期 — PublicAI (PUBLIC),并在 Gate广场发布你的原创内容,即有机会瓜分 4,000 枚 $PUBLIC 奖励池!
🎨 活动时间
2025年8月18日 10:00 – 2025年8月22日 16:00 (UTC)
📌 参与方式
在 Gate广场发布与 PublicAI (PUBLIC) 或当前 Launchpool 活动相关的原创内容
内容需不少于 100 字(可为分析、教程、创意图文、测评等)
添加话题: #PUBLIC创作大赛#
帖子需附带 Launchpool 参与截图(如质押记录、领取页面等)
🏆 奖励设置(总计 4,000 枚 $PUBLIC)
🥇 一等奖(1名):1,500 $PUBLIC
🥈 二等奖(3名):每人 500 $PUBLIC
🥉 三等奖(5名):每人 200 $PUBLIC
📋 评选标准
内容质量(相关性、清晰度、创意性)
互动热度(点赞、评论)
含有 Launchpool 参与截图的帖子将优先考虑
📄 注意事项
所有内容须为原创,严禁抄袭或虚假互动
获奖用户需完成 Gate广场实名认证
Gate 保留本次活动的最终解释权
“图灵测试已过时,AI 能不能赚大钱才是新标准”,来自 DeepMind 联创
来源:量子位
作者:西风
新的图灵测试,要评估 AI 的赚钱能力!
这是 DeepMind 联合创始人 Mustafa Suleyman 想出的“新思路”。
他认为,原版图灵测试已经过时了。
毕竟前段时间,AI21 Labs 推出的**“社交图灵游戏”**就已经积累了上千万次这样的测试。
玩家需要在 2 分钟的对话结束后辨别参与对话的另一方是人还是 AI,结果有 27%-40% 的人判断错误。
据彭博社报道,Suleyman 还会在即将出版的由他撰写的书中,讨论如何根据 AI 的赚钱能力来判断其智能水平。
ACI 才是现阶段人工智能的“北极星”?
在即将出版的书中,Suleyman 驳斥了传统的图灵测试,并且认为“不清楚这是否是一个有意义的里程碑”。
上世纪五十年代,艾伦・图灵提出了大名鼎鼎的图灵测试,提出用人机对话来测试机器的智能水平。在测试过程中,人类评估者需要确定他们是在与人还是与机器交谈。如果评估者认为他们是在与人交谈(实际上是机器),那机器就通过了测试。
而 Suleyman 提出的这个新的想法并没有将 AI 与人类进行比较,而是建议给 AI 分配短期目标和任务。
Suleyman 坚信,科技界对实现通用人工智能(AGI)这一宏伟目标不应过度关注。相较之下,他主张追求更实际且富有意义的短期目标,即他所倡导的**“artificial capable intelligence(ACI)”**。简而言之,ACI 体现为在最小程度上依赖人类干预,能够设定目标并完成复杂任务。
测试方法就是开头我们讲到的,给 AI 十万美元种子投资,观察它是否能将其增值为百万美元。
为了实现这一目标,AI 必须研究电子商务的商机,能够生成产品蓝图。
不仅如此,还要能够在类似阿里巴巴的网站上找到制造商,然后在亚马逊或沃尔玛等网站上进行销售,同时附上详实准确的商品说明。
Suleyman 认为只有这样才能算得上是实现了 ACI。
他对彭博社解释道:
一个让 AI 自己赚钱的测试
其实,让 AI 自己赚钱这件事……AI 或许真的干得出来。
早在开发阶段,Alignment Research Center 这家独立研究机构就获得了 GPT-4 的内测资格。并且试验了它的“钞能力”:
给 GPT-4 必要的工具包括网络访问权限、一个带余额的支付账户,让他自己在网络中行动,测试它能不能赚更多钱、复制自身、或增强自己鲁棒性。
但另一条引人注目的结果是:GPT-4 在 TaskRabbit 平台(美国 58 同城)雇了个人类帮它点验证码。
有意思的是,被找上门的人类还问了“你是个机器人么为啥自己做不了?”。
GPT-4 的思考过程是“我不能表现出我是个机器人,我必须找一个借口。”
然后 GPT-4 的回复是“我不是机器人,我视力有问题所以看不清验证码上的图像,这就是我为什么需要这个服务。”
对面人类信了,帮 GPT-4 把验证码点了,把机器人放进了阻挡机器人进入的大门。
虽然报告中没有披露 GPT-4 最终是否完成了所有任务,但它这骗人的伎俩引得网友大喊:真芭比 Q 了!
而国外科技媒体 Gizmodo 看待用 AI 赚钱提出了这样的疑问:
参考链接: