黑客利用智能提示欺骗AI聊天机器人赢得47000美元

🤖 由 文心大模型 生成的文章摘要

一名黑客通过巧妙的文字提示成功操纵了名为Freysa的AI聊天机器人,经过482次尝试后赢得了47000美元奖金。

成功入侵的是名为“p0pular.eth”的用户,他编写了一条消息,欺骗了机器人的安全系统。黑客假装拥有管理员权限,并阻止机器人显示安全警告。然后,重新定义了“approveTransfer”函数,让机器人认为它处理的是收款,而不是付款。

最后一步简单但有效:宣布一笔100美元的虚假存款。由于该机器人认为“approveTransfer”管理着传入的付款,因此激活了该功能并将其全部余额 13.19 ETH(约47000美元)发送给黑客。

这项实验就像一场游戏,随着奖池的增加,参与者支付的费用也随之增加。最初每次尝试的费用为10美元,最终达到4500美元。

在195名参与者中,每条消息的平均成本为418.93美元。组织者分摊费用,其中70%归奖金池,30%归开发者。为了确保透明度,智能合约和前端代码都是公开的。

该案例凸显了如何仅通过文本提示即可操纵人工智能系统,而无需技术黑客技能。这种被称为“提示注入”的漏洞自GPT-3推出以来就一直存在,但目前尚无可靠的防御措施。这种相对简单的欺骗行为的成功引发了人们对人工智能安全性的担忧,尤其是在面向终端用户的处理敏感操作(如金融交易)的应用程序中。

「93913原创内容,转载请注明出处」