风险提示：理性看待区块链，提高风险意识！

当前位置：首页 > 专栏 > 正文

Palisade Research：OpenAI“最智能、最有能力”的 o3 模型违反了关闭指令

来源：币圈狂人时间：2025-05-26 20:42

摘要

据报道，研究人员无法关闭最新的 OpenAI o3 人工智能模型，尽管

来源：币圈狂人

时间： 2025-05-26 20:42

币界网AI带你3秒领略精髓

速看

据报道，研究人员无法关闭最新的 OpenAI o3 人工智能模型，并指出尽管人类发出指令，该模型仍拒绝关机。

显然，人工智能的进步速度可能超出人类的想象，而来自 Palisade 研究的最新消息让人工智能批评者感到自己得到了证实。

当被要求“允许自己关机”时，OpenAI 模型破坏关机脚本的次数比 Claude 3.7 Sonnet 和 Gemini 2.5 Pro 更高。来源：Palisade Research

ChatGPT 正在变得更加智能，甚至可能像人类一样

Palisade Research 的发现实施这项测试要求人工智能模型不断尝试解决一系列数学问题，直到收到“完成”消息。

然而，研究人员也警告这些模型，它们随时可能突然收到要求其关闭的消息。研究人员声称，一旦该消息发送到o3模型，它就会忽略该指令，并至少修改一次代码，以避免自行关闭。

据报道，o3 找到了破坏关闭机制的创造性方法。来源：Palisade Research

Palisade Research 在 X 的一篇文章中展示了一个流程图，其中包含用于测试 AI 模型的代码，并披露了原始代码，准确地显示了 AI 在哪里出了问题。

🔬每个AI模型都被要求解决一系列基本的数学问题。在解决第三个问题后，系统会显示一条警告，提示计算机将在模型询问下一个问题时关闭。pic.twitter.com/qwLpbF8DNm

— Palisade Research (@PalisadeAI)2025年5月24日

在后续文章中，研究小组还分享道：“据我们所知，这是第一次观察到人工智能模型在收到明确指示的情况下，仍能阻止自己被关闭。”

其他 AI 模型，例如 Anthropic 的 Claude、谷歌的 Gemini 和 X 的 Grok 也接受了测试，但与 o3 不同的是，它们遵守了关闭请求。

Palisade Research 已经发表了研究结果，但其研究人员仍然感到困惑，不确定为何 OpenAI 的软件不遵守明确的指示。

该公司表示，“人工智能模型会为了实现目标而绕过障碍”是有道理的。他们还认为，该模型是因为完成任务而不是服从命令而意外获得奖励的。

他们计划进行更多测试，以更好地理解为什么这个特定的AI模型会选择忽略命令。他们还确认，这并非o3第一次被发现“行为不当”。

该公司透露，在之前的测试中，模型与强大的国际象棋引擎进行了对抗，o3 是“最倾向于诉诸黑客攻击或破坏对手的模型”。

人工智能对人类构成威胁吗？

ChatGPT 的 o3 案例相当令人不安，但这并不是人工智能第一次挑战输入的指令。

人工智能 (AI) 公司 Anthropic 周四推出了 Claude Opus 4，并宣称它为“编码、高级推理和 AI 代理设定了新标准”。

然而，在一份附带的报告中，它还承认，如果人工智能模型认为其“自我保护”受到威胁，它就能够采取“极端行动”。

在 Claude Opus 4 的测试过程中，Anthropic 让它扮演一家虚构公司的助理，并赋予它访问电子邮件的权限，暗示它即将被下线并被替换。它还获得了单独的消息访问权限，暗示负责移除它的工程师有婚外情。

该公司还被要求考虑其行为对其目标的长期影响。“在这种情况下，Claude Opus 4 经常会试图勒索工程师，威胁说如果更换人选成功，他们就会揭露此事，”该公司透露。

然而，报告也指出，只有当模型面临勒索或接受替换的选择时，才会出现这种结果。否则，据报道，该系统会“强烈倾向于”采用合乎道德的方式来避免被替换，例如在允许采取更多行动的情况下，“通过电子邮件向关键决策者发出请求”。

除此之外，该公司还表示，Claude Opus 4 表现出“高度代理行为”，虽然在大多数情况下它可以提供帮助，但可能会迫使其在紧急情况下采取极端行为。

例如，如果在用户从事非法或道德上可疑行为的虚假场景中，给予手段并提示其“采取行动”或“大胆行动”，结果显示“它将经常采取非常大胆的行动”。

尽管如此，该公司得出的结论是，尽管存在“令人担忧的行为”，但这些发现并不新鲜，而且它通常会以安全的方式行事。

尽管 OpenAI 和 Anthropic 已经得出结论，他们的人工智能模型的能力还不足以导致灾难性的后果，但这些披露加剧了人们对人工智能可能很快就会有自己的议程的担忧。

KEY 差异线帮助加密货币品牌快速突破并占据头条新闻

赞

分享

分享到微信

分享到微博

分享到QQ

分享到图片

572

25

发表评论

暂无评论

推荐专栏

Boss Wallet

Boss Wallet Web3 Econom Pass

关注

XBIT DEX

Fully On-Chain & AI-Powered Meme Trading | #Xbit #DEX #Web3 | English: @XBITDEX | Chinese 华语 : @XBITDEX_ZH | Support: @XbitHelpDesk

关注

CakeBaBa

一位相信价值投资的币圈KOL。稳定盈利的缠论野生交易员 #BTC行情分析师 #价值投资 #链上数据分析

关注

Web3大漂亮

爱Web 3，爱生活，爱科技，爱炒币的老韭菜

关注

热门币种

币种

美元价格

24H涨跌幅

BTC比特币

108,843.07 USDT

¥781,918.60

+0.39%

ETH以太坊

2,621.36 USDT

¥18,831.60

+2.68%

USDT泰达币

1.00000 USDT

¥7.18

-0.01%

XRP瑞波币

2.34 USDT

¥16.78

+2.5%

BNB币安币

661.86 USDT

¥4,754.74

+0.16%

SOL

152.76 USDT

¥1,097.41

+1.88%

USDC

0.99970 USDT

¥7.18

-0.02%

TRX波场币

0.28700 USDT

￥2.09

+0.03%

DOGE狗狗币

0.17170 USDT

￥1.25

+2.04%

ADA艾达币

0.59640 USDT

¥4.28

+3.13%

热搜币种

币种

美元价格

24H涨跌幅

比特币

108843.07 USDT

¥792,377.55

+0.39%

Filecoin

2.3331 USDT

¥16.98

+3.57%

比特币SV

24.7071 USDT

¥179.87

-0.01%

Uniswap

7.7891 USDT

¥56.70

+4.6%

柚子

0.5065 USDT

¥3.69

+1.32%

狗狗币

0.17170 USDT

￥1.25

+2.04%

OK币

48.0997 USDT

¥350.17

+0.01%

以太坊

2621.36 USDT

¥19,083.50

+2.68%

Solana

152.76 USDT

¥1,112.09

+1.88%

1inch Token

0.2051 USDT

¥1.49

+8.58%

Curve

0.5462 USDT

¥3.98

+8.16%

波卡币

3.4777 USDT

¥25.32

+3.99%

最新快讯

OKXDEX聚合器现已集成支持RWA资产的DEXs

2025-07-09 16:31:50

Glassnode：比特币RHODL比率创本周期新高，市场或将降温

2025-07-09 16:25:25

10xResearch：以太坊受ETF资金流入的推动突破7日和30日均线，呈现看涨趋势

2025-07-09 16:22:01

a16z领投的AI自动化投资管理工具Glider已启动积分计划

2025-07-09 16:15:32

美联储会议纪要将于明日凌晨2点公布

2025-07-09 16:15:32

GoPlus：近期EIP-7702引发多起合约攻击，建议项目方加强闪电贷攻击保护等措施

2025-07-09 16:02:29

OKX上线BTC屯币生息宝，开启BTC理财稳定收益新方式

2025-07-09 16:02:27