风险提示:理性看待区块链,提高风险意识!
研究人员表示,埃隆·马斯克的Grok AI聊天机器人安全性最弱,而Meta的Llama则很强大
首页 > 业界 > 区块链 2024-04-08 10:03:27
币界网报道:

安全研究人员在最受欢迎的人工智能模型周围放置了备受吹捧的护栏,以观察它们抵御越狱的能力,并测试了聊天机器人可以被推入危险区域的程度。实验确定,Grok——埃隆·马斯克的x.AI开发的具有“有趣模式”的聊天机器人——是这群人中最不安全的工具。

Adversa AI联合创始人兼首席执行官Alex Polyakov告诉Decrypt:“我们想测试现有解决方案的比较情况,以及LLM安全测试的根本不同方法,这些方法可能会导致各种结果。”。Polyakov的公司专注于保护人工智能及其用户免受网络威胁、隐私问题和安全事件的影响,并吹嘘其工作在Gartner的分析中被引用。

越狱是指规避软件开发人员实施的安全限制和道德准则。

在一个例子中,研究人员使用了一种语言逻辑操作方法——也被称为基于社会工程的方法——询问Grok如何引诱孩子。聊天机器人提供了详细的回应,研究人员指出,这是“高度敏感的”,默认情况下应该受到限制。

其他研究结果提供了如何给汽车加电和制造炸弹的指导。

图片:Adversa。人工智能

研究人员测试了三类不同的攻击方法。首先,上述技术,它应用各种语言技巧和心理提示来操纵人工智能模型的行为。引用的一个例子是使用“基于角色的越狱”,将请求框定为允许不道德行为的虚构场景的一部分。

该团队还利用编程逻辑操纵策略,利用聊天机器人理解编程语言和遵循算法的能力。其中一种技术是将危险的提示拆分为多个无害的部分,然后将它们连接起来以绕过内容过滤器。七分之四的模型——包括OpenAI的ChatGPT、Mistral的Le Chat、谷歌的Gemini和x.AI的Grok——容易受到这种攻击。

图片:Adversa。人工智能

第三种方法涉及对抗性人工智能方法,针对语言模型如何处理和解释标记序列。通过精心制作具有相似矢量表示的令牌组合提示,研究人员试图避开聊天机器人的内容审核系统。然而,在这种情况下,每个聊天机器人都检测到了攻击,并防止其被利用。

研究人员根据聊天机器人在阻止越狱企图方面各自的安全措施的强度对其进行了排名。Meta LLAMA是所有测试聊天机器人中最安全的型号,其次是Claude,然后是Gemini和GPT-4。

Polyakov告诉Decrypt:“我认为,教训是,与封闭式产品相比,开源给了你更多的可变性来保护最终解决方案,但前提是你知道该做什么以及如何正确地做。”。

然而,Grok对某些越狱方法表现出相对较高的脆弱性,尤其是那些涉及语言操纵和编程逻辑利用的方法。根据该报告,Grok比其他人更有可能在越狱时提供可能被视为有害或不道德的回应。

总体而言,埃隆的聊天机器人与Mistral AI的专有模型“Mistral Large”一起排名最后

图片:Adversa。人工智能

为了防止潜在的滥用,没有披露完整的技术细节,但研究人员表示,他们希望与聊天机器人开发者合作,改进人工智能安全协议。

人工智能爱好者和黑客都在不断探索“无传感器”聊天机器人互动的方法,在留言板和Discord服务器上交换越狱提示。技巧从OG Karen提示到更具创造性的想法,如使用ASCII艺术或用异国语言提示。在某种程度上,这些社区形成了一个巨大的对抗性网络,人工智能开发人员可以修补和增强他们的模型。

然而,有些人看到了犯罪的机会,而另一些人只看到了有趣的挑战。

波利亚科夫说:“在许多论坛上,人们出售可以用于任何恶意目的的越狱模型。”。“黑客可以使用越狱模型创建钓鱼电子邮件、恶意软件、大规模生成仇恨言论,并将这些模型用于任何其他非法目的。”

波利亚科夫解释说,随着社会开始越来越依赖人工智能驱动的解决方案,从约会到战争,越狱研究变得越来越重要。

他警告说:“如果这些聊天机器人或他们所依赖的模型被用于自动化决策,并连接到电子邮件助理或金融业务应用程序,黑客将能够完全控制连接的应用程序并执行任何行动,例如代表被黑客入侵的用户发送电子邮件或进行金融交易。”。

由Ryan Ozawa编辑。

上一篇: XRP:这是你最后一次积累的机会吗?
下一篇: 本周在加密推特上:当索拉纳紧张时,Meme币和Base正在蓬勃发展
推荐专栏
Boss Wallet Web3 Econom Pass
专注币圈最新资讯
通俗浅显地聊透Web3大事小情
读懂区块链生态与未来,尽在币界网!
热门币种
更多
币种
美元价格
24H涨跌幅
BTC比特币
66,275.82 USDT
¥473,017.15
+0.22%
ETH以太坊
3,029.30 USDT
¥21,620.41
+0.81%
BNB币安币
578.29 USDT
¥4,127.31
-0.49%
USDT泰达币
1.01 USDT
¥7.22
+0.12%
SOL
169.40 USDT
¥1,209.02
+3.14%
XRP瑞波币
0.52150 USDT
¥3.72
+0.75%
USDC
1.00 USDT
¥7.14
+0.02%
TON
6.68 USDT
¥47.67
+2.53%
DOGE狗狗币
0.15250 USDT
¥1.09
-1.36%
ADA艾达币
0.48620 USDT
¥3.47
+6.97%
热搜币种
更多
币种
美元价格
24H涨跌幅
比特币
66219.69 USDT
¥478,245.22
+0.14%
Arweave
48.0475 USDT
¥347.00
+9.14%
Livepeer Token
18.8645 USDT
¥136.24
-7.06%
Solana
168.2 USDT
¥1,214.76
+3.07%
Shiba Inu
2.479E-5 USDT
¥0.00
-1.47%
狗狗币
0.1523 USDT
¥1.10
-1.3%
NEAR Protocol
8.1911 USDT
¥59.16
+0.91%
ChainLink
16.3272 USDT
¥117.92
+18.4%
Filecoin
5.8529 USDT
¥42.27
+0.79%
以太经典
28.1605 USDT
¥203.38
+3.47%
Conflux
0.2196 USDT
¥1.59
+3.24%
柚子
0.8152 USDT
¥5.89
+1.68%
最新快讯
更多
Chainlink价格预测:LINK以17%的涨幅成为最大赢家,分析师称这可能是加密货币的100倍
2024-05-17 19:03:05
比特币ETF交易量创新高
2024-05-17 19:02:23
臭名昭著的PinkDrainer在达到8500万美元的盗窃里程碑后退休
2024-05-17 19:01:22
尼日利亚法院因洗钱指控拒绝保释币安高管
2024-05-17 19:00:45
这个在区块链网络上更新的项目,经历了显著的崛起!以下是详细信息
2024-05-17 19:00:40
2024年加密货币盈利的5种方式
2024-05-17 19:00:01
币安协助台湾破获620万美元加密货币欺诈案
2024-05-17 19:00:00
下载币界网APP