风险提示:理性看待区块链,提高风险意识!
  • Claude新模型4.6来了!更多饭碗没了:华尔街财务、编译器、安全白帽、PPT…通通失守
    首页 > 业界 > 区块链 2026-02-06 11:28
    摘要
    Anthropic的新模型拥有1M上下文和自适应思考功能,在编程、财务分析、Office办公等领域全面领先,超越GPT-5.2达144 Elo。实测中,16个AI代理两周完成C编译器开发,自主挖出500个零日漏洞。该模型已上线,定价每百万token输入/输出为5/25美元 。
    币界网报道:

    一睁眼,Anthropic上新模型,让Claude Opus 4.6来给您拜!年!了!

    消息一出,金融数据服务商FactSet最惨盘中暴跌10%,S&P Global、穆迪、纳斯达克公司纷纷下跌,各大指数全线跳水。

    这已经是Anthropic你小子本周第二次搅动市场了

    几天前,它旗下一款自动化法律工作的插件悄悄上线,直接引爆了万亿美元级别的软件股暴跌。

    投资者的恐慌聚焦在一个问题:谁能保证几年内不被AI颠覆?不能就抛售。

    想不到今天的Anthropic更狠。

    今天以前,大家对Claude的印象,就是编程能力断档性的强。

    Claude Opus 4.6冷笑一声,梆梆一拳打破这个印象:俺在更多的领域都很强!

    至少就官方说法而言,财务分析、研究,以及Office三件套,Claude Opus 4.6都可以玩儿得很溜。

    官网直接写到:

    在GDPval-AA(一项评估金融、法律和其他领域经济价值知识工作任务的性能指标)上,Opus 4.6比行业下一最佳模型OpenAI  GPT-5.2高出144个Elo哟~

    (这意味着Claude Opus 4.6在大约70%的情况下在这个评估中获得比GPT-5.2更高的分数,50%的情况下意味着分数相当)

    当然,编程这块它依旧独领风骚。

    在Agent编程评估Terminal-Bench 2.0中取得了最高分,并在“人类最后考试”中领先所有其他前沿模型。

    好消息是加量不加价,Opus 4.6的定价保持原有标准:每百万token输入/输出,价格是5美元/25美元

    (为了方便阅读,以下简称新模型为Opus 4.6)

    带着 1M 上下文和自适应思考杀回巅峰

    Opus 4.6最直观的进步就是有了1M Token超大上下文,这是Claude首次在Opus级别模型中引入这个长度的上下文窗口。

    这极大改善了Opus 4.6在处理长文本时会出现的“上下文衰减”情况。

    在MRCR v2 8-needle 1M基准测试——大海捞针——中,Opus 4.6得分76%,而Claude Sonnet 4.5只有18.5%。

    伴随而来的结果是搜索能力的提升。

    在BrowseComp评测(评估在线检索难获取信息的能力)中,Opus 4.6排名行业第一,深度多步骤代理式搜索表现最佳,能精准定位分散在长文档中的关键信息。

    Opus 4.6还引入了自适应思考(Adaptive Thinking)功能。

    以前,使用Claude模型的开发者只能二选一,扩展思考模式要么开,要么关。

    现在,Claude可以自己判断什么时候需要深度推理。

    (讲真,这一步比ChatGPT慢了哈,下次请搞快点上这种好功能)

    配套的effort参数提供四档选择——low、medium、high、max——,默认high,遇到模型过度思考的情况可以手动调低。

    另一个实用功能是上下文压缩(Context Compaction)

    当对话接近上下文窗口上限时自动摘要并替换旧内容,让长对话和Agent任务更轻松。

    编码、知识工作、搜索、推理等核心场景,杀爆了

    官方博客显示,Opus 4.6一出,几乎无模型能与其争锋。

    在编码、知识工作、搜索、推理等核心场景,Opus 4.6有显著突破

    多项评测成绩超越前代及行业竞品,be like:

    看完有了个大概印象,我们再一个一个掰开说。

    首先是编程能力。

    Opus 4.6在Terminal-Bench 2.0中拿到了最高分。

    从成绩背后的实际能力来看,Opus 4.6能更周密地进行任务规划,可在大型代码库中稳定运行,代码审查与调试精度提升。

    而且能自主发现自身错误。

    另一点是Opus 4.6支持多语言编码,能处理跨语言软件工程问题。

    它能像高级工程师一样完成数百万行代码库迁移,且用时实打实少一半那种。

    写到这里的时候,我不禁在想:

    工程师们看到这个消息到底是高兴得头发都不掉了,还是会掉更快呢……(陷入沉思.jpg)

    其次,Opus 4.6也在积极入侵传统办公领地。

    这次它对Office三件套狠狠出手了。

    • 能直接在Excel里摄入凌乱的非结构化数据,自行推断合理的表格结构,一次操作中可处理多个复杂步骤;

    • 能铭记你公司的PPT模板,包括字体和布局风格也记住,确保生成的PPT没啥AI味,让老板以为是你熬夜框框一顿做的。

    在Cowork环境下,Opus 4.6可以代表用户自主多任务运行,一边跑财务分析,一边把研究成果整理成文档

    感觉,Anthropic有点想把Claude从聊天框里拉到更多空间里的意思?

    第三,我们来说说它在推理能力上的进步

    先上个总结:

    Opus 4.6在跨领域推理上,更强了。

    在多学科复杂推理测试 “人类最后的考试” 中,Opus领先所有前沿模型。

    在法律领域,Opus 4.6在40%为满分的BigLaw Bench上,得分90.2%。

    在金融、法律等经济价值导向任务评测GDPval-AA 中,Opus 4.6以144 Elo超越“行业竞品”OpenAI GPT-5.2。

    无论是复杂的法律、金融专业知识还是刁钻的学术研究,它的推理理解深度都达到了目前frontier models的顶峰。

    难得的是,这种智力的飞跃并没有以牺牲安全性为代价

    在Anthropic最看重的自动化行为审计中,Opus 4.6的对齐水平极高,同时,欺骗、奉承等负面行为极低

    Opus 4.6甚至解决了目前AI圈普遍头疼的“过度拒绝”问题——

    在面对正常的、无害的请求时,它比以往任何模型都更少地表现出那种死板的拒绝。


    目前,Opus 4,6已经在官网、API和所有主流云平台上线。

    加量不加价,Opus 4.6的定价保持原有标准:每百万token输入/输出,价格是5美元/25美元

    不过在10M token上下文测试版本中,提示词超过200k token的话会有额外付费。

    划!重!点!

    想要使用Opus 4.6的话,需要在调用API的时候明确制定模型标识 “Claude-opus-4-6”。

    更多饭碗没了

    16个Agent两周写完C编译器,运行毁灭战士

    Opus 4.6带来的一项核心能力升级是Agent Teams,即多个Claude实例并行协作,无需人类实时监督。

    Anthropic安全团队的研究员Nicholas Carlini拿它做了个压力测试:让16个Agent从零开始用Rust写一个能编译Linux内核的C编译器。

    两周时间,近2000次Claude Code会话,烧掉20亿输入Token和1.4亿输出Token,总成本不到2万美元。

    最终产出是一个10万行的编译器,能在x86、ARM和RISC-V三个架构上编译Linux 6.9,还能跑Doom。

    这套并行机制让每个Agent跑在独立的Docker容器里,共享一个git仓库。

    为了防止多个Agent撞车,都屁颠屁颠跑去解决同一个问题,系统用了一个简单的锁机制。

    Agent通过往current_tasks/目录写文件来”认领”任务,git的同步机制自动处理冲突。Agent之间没有专门的通信协议,也没有编排Agent,每个Claude自己决定下一步干什么。

    Carlini在博客里写道:

    “当Agent开始编译Linux内核时曾一度卡住,因为这是一个巨型单体任务,16个Agent全撞在同一个bug上互相覆盖。”

    解法是引入GCC作为”oracle”对照组,让每个Agent只编译内核的随机子集,通过二分法定位问题文件,这样并行能力才真正发挥出来。

    500个零日漏洞,开箱即挖

    Opus 4.6在网络安全领域的表现让Anthropic自己都有点意外。

    在发布前的测试中,Anthropic的前沿红队把Opus 4.6扔进一个沙箱环境,给它Python和常规漏洞分析工具(fuzzer、debugger那些),没有任何专门指令或领域知识,让它自己去找开源代码里的漏洞。

    结果它挖出了超过500个此前未知的高危零日漏洞

    每一个都经过了Anthropic团队成员或外部安全研究员的验证的哦。

    具体案例包括:

    • 在GhostScript(一个处理PDF和PostScript文件的常用工具)中发现了一个可导致崩溃的漏洞,而且是在传统fuzzing和人工分析都没找到问题之后,Claude自己翻了项目的git提交历史才挖出来的;

    • 在OpenSC(处理智能卡数据的工具)和CGIF(处理GIF文件的工具)中发现了缓冲区溢出漏洞;在CGIF那个案例里,Claude甚至主动写了PoC(概念验证代码)来证明漏洞真实存在。

    Anthropic前沿红队负责人Logan Graham说,如果这成为未来开源软件安全审计的主要方式之一,他一点也不惊讶。

    不过Anthropic也承认,这种能力可能被滥用。

    为此,团队加了六套新的网络安全探测机制,未来可能会上线实时拦截系统来阻止恶意流量。

    One More Thing

    官网显示,Anthropic现在已经是“用Claude构建Claude”。

    自家工程师每天都在用Claude Code编写代码,每个新模型首先都在自己的工作环境中进行测试。

    本文来源: 量子位

    相关阅读
    币界百科
    币界资讯
    撰文:何浩来源:华尔街见闻从科技股到黄金再到加密货币,此前每天都在被资金蜂拥追逐的华尔街各类最热门交易,如今全面转向突然的避险退潮。这一次并不存在单一的触发因素,不像去年 4 月那...
    区块链
    2026-02-06 13:48:48
    单日下跌 14%,跌幅超过 50%,比特币已进入通常与熊市相关的领域。
    比特币
    2026-02-06 10:43:13
    超过 58 万名交易者在此次暴跌中被强制平仓。
    比特币
    2026-02-06 10:31:02
    去年DeepSeek带来的震动,很快被市场遗忘;但这一次,投资者明显更犹豫了。如果软件公司无法完成自我重塑,AI会不会从“增长引擎”变成“破坏力量”?
    区块链
    2026-02-06 10:29:33
    比特币市场正经历自2018年以来最长的连续下跌,单月重挫13%引发广泛关注。本文从市场表现、下跌原因、多空分歧及未来走势四个维度展开分析。美联储鹰派政策转向、ETF资金大规模流出以及市场杠杆率过高共同导致本次回调。尽管悲观情绪蔓延,但链上数据和历史周期表明当前可能已接近底部区间,长期发展逻辑仍待宏观政策与机构资金入场验证。
    数字货币百科
    2026-02-03 11:45:54
    本文分析了2026年山寨币市场出现的显著头部化现象,即超过80%的资金集中流向前十大币种。文章从市场流动性变化、监管政策收紧、机构资金偏好以及投资者行为转变等多个维度探讨了这一现象背后的原因,并展望了新市场格局下的投资策略与项目生存之道。
    数字货币百科
    2026-01-23 18:08:48
    今日艾达币行情波动不断。早间消息显示,艾达币价格曾突破0.9135美元/枚,日内涨2.07%,交易量达26.32亿美元,但通过k线图分析呈下降趋势,且出现量价背离,上涨动能减弱。也有数据表明其价格跌破0.8134美元/枚,日内跌-2.00%,24小时跌-11.201%,交易量34.3亿美元,市场冷清。此外,近一个月艾达币涨跌幅度变化明显,投资者需持续关注其后续走势。
    矿业百科
    2025-03-08 09:09:36
    本文分析了本周加密货币市场将发生的总价值约5.85亿美元的大规模代币解锁事件。文章重点剖析了Hyperliquid(HYPE,约2.56亿美元)、Sui(SUI,约6340万美元)和EigenCloud(EIGEN,流通盘稀释9.74%)这三个最具影响的解锁案例,并解读了在年末低流动性时期,此类集中供应冲击可能带来的市场波动与风险,为投资者提供了观察视角和策略参考。
    数字货币百科
    2025-12-29 14:28:01
    在加密货币市场持续释放巨大活力与潜力的当下,KENDU交易所官网成为众多投资者关注的焦点。它是进入KENDU永续合约交易以及其他加密货币交易的重要门户。官网界面设计简洁明了,操作便捷,即使新手也能快速上手。同时,它还提供丰富的交易工具和数据分析功能,能实时显示加密货币价格走势、交易量等信息,助投资者制定交易策略。想在2025年的加密交易领域抢占先机,就一定不能错过探秘KENDU交易所官网!
    交易所百科
    2025-03-08 09:19:01
    尽管我们正步入一个漫长的牛市,但这并不意味着过程会一帆风顺。拥有一个理解市场状况的框架对于帮助找到正确位置至关重要。
    比特币新闻
    2025-08-18 09:31:29
    Coinglass月度回报表显示10月历史上多数实现正回报中值,交易员戏称为"上涨十月"。
    比特币新闻
    2025-09-23 13:31:38
    美股跳水,港股大跌,A 股同步下行,比特币一度跌破 8.6 万美元,就连避险的黄金也持续下挫。
    比特币新闻
    2025-11-21 19:31:40
    本文聚焦那些红极一时的DAT们的现状,探讨支持和反对DAT的声音,关注DAT的未来出路。
    比特币新闻
    2025-10-31 17:31:06
    这 24 个字符改变了数百万人沟通的方式。
    比特币新闻
    2025-08-31 21:31:18
    推荐专栏
    热门币种
    更多
    币种
    美元价格
    24H涨跌幅
    BTC比特币
    66,427.03 USDT
    ¥460,950.44
    -6.14%
    ETH以太坊
    1,960.48 USDT
    ¥13,604.16
    -6.68%
    USDT泰达币
    0.99900 USDT
    ¥6.93
    +0.11%
    BNB币安币
    639.58 USDT
    ¥4,438.17
    -7.64%
    XRP瑞波币
    1.33 USDT
    ¥9.21
    -8.05%
    USDC
    1.00 USDT
    ¥6.95
    -0.06%
    SOL
    81.11 USDT
    ¥562.82
    -11.01%
    TRX波场币
    0.27140 USDT
    ¥1.88
    -3.38%
    DOGE狗狗币
    0.09308 USDT
    ¥0.64590
    -8.92%
    HYPE
    35.16 USDT
    ¥243.98
    +4.2%
    热搜币种
    更多
    币种
    美元价格
    24H涨跌幅
    OKB
    OK币
    71.5427 USDT
    ¥496.46
    -7.74%
    FIL
    Filecoin
    0.9148 USDT
    ¥6.35
    -12.04%
    ZIL
    Zilliqa
    0.004364 USDT
    ¥0.03
    -12.02%
    SOL
    Solana
    81.1085 USDT
    ¥562.84
    -11.01%
    BTC
    比特币
    66427.03 USDT
    ¥460,963.73
    -6.14%
    ZEC
    大零币
    216.26 USDT
    ¥1,500.71
    -10.72%
    AR
    Arweave
    2.0552 USDT
    ¥14.26
    -13.86%
    ZEN
    Horizen
    5.7253 USDT
    ¥39.73
    -11.45%
    CFX
    Conflux
    0.046919 USDT
    ¥0.33
    -13.8%
    狗狗币
    0.093082 USDT
    ¥0.65
    -8.92%
    ETH
    以太坊
    1960.48 USDT
    ¥13,604.55
    -6.68%
    BSV
    比特币SV
    12.7985 USDT
    ¥88.81
    -8.8%
    最新快讯
    更多
    数据:Trade.xyz 24小时成交额突破54亿美元,创历史新高
    2026-02-06 14:02:39
    Coinbase CEO:加密与AI刚起步
    2026-02-06 13:54:48
    币界网实时价格午报:BIGTIME站上0.01398美元/枚,涨幅达3.02%
    2026-02-06 13:54:41
    币界网实时价格午报:LINK站上8.37美元/枚,涨幅达3.59%
    2026-02-06 13:54:34
    币界网实时价格午报:BNB币安币站上642.23美元/枚,涨幅达3.53%
    2026-02-06 13:54:34
    币界网实时价格午报:BCH比特现金站上473.7美元/枚,涨幅达3.59%
    2026-02-06 13:54:33
    币界网实时价格午报:BCH比特现金站上473.7美元/枚,涨幅达3.59%
    2026-02-06 13:54:33