河池镀铜钢绞线 刚刚, Claude Opus 4.6登顶编程之! 入Office全桶, 15亿工东谈主变天
2026-02-14 18:16:40 51

新智元报谈河池镀铜钢绞线
剪辑:桃子 好困
【新智元读】通盘硅谷又癫狂了!Anthropic夜扔出炸,Claude 4.6用近乎的编程智商和智能体军团,给OpenAI和上了堂名为「降维击」的课。
Anthropic夜惊雷,终于祭出了编程之!
刚刚,Claude Opus 4.6横空出世,夜成为行家强编程AI,「模」能敌。
它在前代Opus 4.5的基础上,大幅升迁了编码妙技。
Claude Opus 4.6的磋商致密,能历久地本质AI Agent任务,在大范围代码库中运行也加可靠。
枢纽的是,它还具备强自我纠错智商,比如的代码审查、调试。
它亦然Anthropic款在beta阶段,高下文支援100万token的Opus模子。
在多项基准测试中,Claude Opus 4.6编程实力险些全位先,Gemini 3 Pro、GPT-5.2可望不可即。
在ARC-AGI-2上,Opus 4.6拿下68.8分,过GPT-5.2-xhigh
(傍边滑动稽查)
不仅如斯,Opus 4.6经上线,就启动鼎新办公了!
今天,这款新模子同期在Excel、PPT中的Claude,以及Claude Code、API中同步上线。
比如奥运长跑鞋供应链数据,和我方展望的不样,好几个季度数据不行眼过完,不错枢纽向Opus 4.6求救。
它会遍历文献夹下通盘Excel表,成功捏出邪恶的地,还能同步画图出折线图。
一样在PPT中,也能及时调用Opus 4.6了,从布局、字体到母板,Claude都能确保内容符设施。
从今天起,Claude Opus 4.6不错在Claude网页端、开荒者平台,以及各大平台成功可上手。
硅谷今晚的炸药味,只怕要突破屏幕了......
Opus 4.6发布后没几分钟,OpenAI枢纽掏出GPT-5.3-Codex。
眼瞧着奥特曼发了预报,Anthropic坐窝火速亮剑。只可说,起了个大早赶了个晚集
「编程新」夜炸场,鼎新行家工东谈主
Claude Opus 4.6的官宣,不错说是Anthropic次紧要改革。
认真东谈主Alex Albert是这样说的,「Claude在2025颠覆了编程,在2026年将重塑常识型使命」!
Opus 4.6不仅是次毛糙的模子升,而是AI确凿成为东谈主类「职场伙东谈主」的分水岭——
尤其是关于那些每天泡在表格、PPT和长文档里的工东谈主。恰是这类使命,扶直起了金融和接洽等中枢产业。
在真实的金融任务测试中,Opus 4.6比几个月前业界顶的Sonnet 4.5,足足升迁了23以上。
在这个时间,「几个月前」听起来就像上个世纪。
而且这些测试点都不详尽河池镀铜钢绞线,全是实实的硬活:建财务模子、作念路演 PPT、搞并购分析。往日分析师得接力好几周的使命,咫尺瞬息就能完成。
在往常使命任务中,Opus 4.6将成为强助力——
运行财务分析、进行度陆续,以及使用和创建Word、Excel、PPT,完全不错调用。
值得提的是,据不统计,行家约有15亿东谈主都在Office全桶上办公,Opus 4.6正在激勉场层的办公率变革。
不仅如斯,在Claude Cowork中,Opus 4.6不错成功成为「牛马」手替,完成以上切复杂任务。
在输出质料上,Opus 4.6也有了质的飞跃。
往日的模子可能需要反复修改好几轮,致使根底搞不定;但咫尺,版出来的东西往往就能成功用了。
Cowork让你丢进通盘文献夹就能同期启动多项分析;
Excel里的Claude 贬责起多表财务模子来驾轻就熟,不跑偏;
PowerPoint里的Claude,让你能成功在软件里生成和修改。
正如AI抹平了开荒的门槛,它也将重塑每位常识使命者的智商鸿沟。
场出产力的范式调遣已不得不发,序幕才刚刚开启。
碾压Gemini 3、GPT-5.2
SOTA拿成功软
大要动这种出产力范式的迁徙,前提定是,有个实力全位能的模子。
Opus 4.6作念到了!它在多项评估中的施展均达到了SOTA——
在智能体编程评估Terminal-Bench 2.0中,它拿下了65.4的分;在HLE测试中,跑通盘其他前沿模子。
枢纽的是,在GDPval-AA常识使命的能评估中,Opus 4.6比GPT-5.2出约144 Elo分,比上代 Opus 4.5出190分。
另外,Opus 4.6在智能体搜索BrowseComp基准上,施展完胜任何模子。
从的基准PK中看,在智能体编程、计较机使用、器具使用、搜索和金融域,Opus 4.6是业界先的模子,势加表示。
在智能体器具使用t2-bench中,Opus 4.6拿下了近满分的收获,售91.9,电信99.3。
Opus 4.6在从海量文档中检索相干信息面,施展得好。
这种智商延迟到了长高下文任务中,它不错在数十万Token中保存和追踪信息,且漂移少,况且能捕捉到即使是Opus 4.5也会错过的埋细节。
AI模子个常见的痛点是「高下文衰减」(context rot),钢绞线厂家即跟着对话过定数目的Token,能会下跌。
Opus 4.6施展表示于其前身:在MRCR v2的8-needle 1M变体(种「大海捞针」基准测试)上,其得分为 76,而Sonnet 4.5得分仅为18.5。
这代表了模子在保持峰值能的同期,本色可用高下文数目上的质的飞跃。
一言以蔽之河池镀铜钢绞线,Opus 4.6擅长在长高下文中查找信息,擅长在招揽该信息后进行理,况且总体上具有表示强的明智商。
底下的图表流露了, Claude Opus 4.6 在各式基准测试中的施展。
这些测试评估了其软件工程妙技、多讲话编程智商、恒久致、收罗安全智商过火生命科学常识。
傍边滑动稽查
Claude Code「智能体群」登场
东谈主教化AI雄兵
值得提的是,Opus 4.6度集成到了Claude Code中。
如今,在Claude Code中,开荒者不错组建智能体团队(agent teams)来协同贬连累务。
也即是东谈主们近推敲热的「智能体群」(Agent Swarms)。
Claude Code之父Boris Cherny警告,尚在实验阶段,可能会奢靡无数token
从此以后,不再仅仅单个Claude鳏寡茕独、绳趋尺口头贬连累务。
如今,「主智能体」不错将任务分发给多个「Claude团队成员」。其他AI不错并行开展调研、调试和开荒使命,并及时保持交流和谐。
这意味着,个开荒者不错带Claude雄兵搞开荒了。只好动动嘴刻画下想法,就能写出软件。
在官文档先容中,Anthropic将其称之为「多Claude Code会话团队编排」(Orchestrate teams)。
每次任务中,都会有个头东谈主Claude在AI雄兵中挑起重任,认真统筹全局、分派任务并汇总终后果。
不错使用Shift+Up/Down或tmux成功摄取任何子智能体(subagent)
其他AI则在各自强的高下文中各司其职,况且互相之间不错成功交流。
这与「子智能体」有所不同:子智能体运行在单会话内,只可向主智能体申报;
而关于「AI智能体团队」,开荒者不错逾越认真东谈主成功与任何个成员进行交互。
鄙人面demo中,不错看到在同个界面中,多个Agent同步本质任务,让路发率狂飙。
2万好意思金,16个Claude组团写10万行C编译器
这不,Anthropic了个样,让Opus 4.6智能体群造出款C编译器,东谈主类只「旁不雅」险些不烦嚣。
手机号码:13302071130两周后,它收效在Linux内核中运行了!
实验中,团队让16个Claude Opus 4.6,在莫得任何东谈主类烦嚣的情况下,并行和谐开荒代码。
为了测试这套系统的限,给这群AI派了个硬核任务——从启动用Rust讲话写个C编译器,而且办法是须能编译Linux内核。
16个Claude狂「加班」,奢靡了近20亿个输入Token,所有掉了约2万好意思元的API资本。
实验经过异常有真谛,Nicholas Carlini构建了个自动轮回系统,让Claude 完不成任务就不准「放工」。
这里只想mark下Dario Amodei这句话:畴昔6-12月,软件工程不再需要东谈主类
为了止AI们架,他盘算推算了套基于Git任务锁机制,让不同的Claude认真不同的模块:
有的在解 Bug,有的在写文档,有的在化代码质料,致使还有门认真「吐槽」架构并进行重构的。
终后果令东谈主轰动:这支AI战队真实撸出了个10万行代码的编译器!
它不仅能收效编译Linux 6.9内核(支援x86、ARM和RISC-V架构),还能跑通《撤消战士》(Doom)、PostgreSQL、Redis等复杂神气。
Claude创造Claude,学会度想考
在Anthropic里面,团队用Claude来构建Claude。
工程师每天都使用Claude Code编写代码,每款新模子都会先在里面使命中进行测试。
关于Opus 4.6,团队发现不错在需被示知的情况下,加注于任务中具挑战的部分,在较毛糙的部分快速进,以好的判断力贬责牵丝攀藤的问题,并在长的会话中保持。
Opus 4.6经常会进行度的想考,并在笃定谜底之前仔细地再行注视其理经过。
这在贬责较难的问题时会产生好的后果,但在较毛糙的问题上可能会增多资本和延迟。
要是发现模子在某个特定任务上「想太多」,提议将 Effort(想考力度)从默许建造()调低至中等。
傍边滑动稽查
加入百万token高下文鼎新
在API上,Claude不错用「高下文压缩」来往首其高下文,从而在不波及章程的情况下,本质运行本事长的任务。
团队还引入了「自适应想考」(adaptive thinking)——模子不错凭据高下文行踪感知何时需要使用彭胀想考;
以及,全新的Effort(想考力度)收敛,让路发者对智能、速率和资设施有多掌控权。
在API订价面,Claude Opus 4.6输入价钱5好意思元/百万token,输出价钱25好意思元/百万token。
此外,Opus 4.6是款支援100万Token高下文的Opus别模子。
关于过200k Token的教唆词,将按费率计费(每百万输入/输出 Token划分为10好意思元/37.5好意思元)。
另外,Opus 4.6支援达128k Token的输出,这让Claude需将任务明白为多个肯求即可完成大输出量的任务。
关于需要在好意思运行的使命负载,不错使用仅限好意思国理(US-only inference),价钱为Token订价的1.1倍。
安全,听话
智能的升迁并非以捐躯安全为代价。
在自动化活动审计中,Opus 4.6施展出较低的未对王人活动(misaligned behaviors)发生率,如糊弄、恭维夤缘(sycophancy)、滋长用户休想以及配滥用。
总体而言,它与咱们迄今为止对王人的前沿模子Opus 4.5样对王人细密。
Opus 4.6还流泄漏在职何近的Claude模子中低的过度拒(over-refusals)率——即模子拒回报良查询的情况。
后,用Anthropic认真东谈主Alex Albert句话记忆Claude Opus 4.6的这场发布——
2025年是AI编程走向普及的元年,而2026年,AI将在编程以外的通盘域爆发。
参考贵寓:
https://www.anthropic.com/news/claude-opus-4-6
https://x.com/claudeai/status/2019467372609040752
相关词条:铁皮保温施工 隔热条设备 锚索 离心玻璃棉 万能胶生产厂家新闻资讯
热点资讯
-
1.缓粘结钢绞线 打网络战,美国为何敢调
- 1

- 缓粘结钢绞线 打网络战,美国为何敢调
- 2026-01-14
- 1
-
2.缓粘结钢绞线 一起为国足加油!U23亚洲杯中国队今晚战伊拉
- 2

- 缓粘结钢绞线 一起为国足加油!U23亚洲杯中国队今晚战伊拉
- 2026-01-08
- 2
-
3.缓粘结钢绞线 023期陈青峰快意8预测号:冷温热码比参考
- 3

- 缓粘结钢绞线 023期陈青峰快意8预测号:冷温热码比参考
- 2026-01-23
- 3
-
4.盐城锚索价格 金海通:拟投资不外4亿元建设“上海澜博半体开采
- 4

- 盐城锚索价格 金海通:拟投资不外4亿元建设“上海澜博半体开采
- 2026-02-11
- 4
-
5.临汾gj35钢绞线参数 庭院骨架植物集锦, 能找到的这里王人
- 5

- 临汾gj35钢绞线参数 庭院骨架植物集锦, 能找到的这里王人
- 2026-02-15
- 5
-
6.缓粘结钢绞线 一飞冲天!卡斯尔空切接球 腾空暴起双手大力灌
- 6

- 缓粘结钢绞线 一飞冲天!卡斯尔空切接球 腾空暴起双手大力灌
- 2026-01-08
- 6
-
7.南通锚索厂 2025年大商所商品期货期权总成交量26亿手
- 7

- 南通锚索厂 2025年大商所商品期货期权总成交量26亿手
- 2026-03-07
- 7
-
8.三门峡钢绞线供应厂家 好思你:公司已于2025年审议通过了《
- 8

- 三门峡钢绞线供应厂家 好思你:公司已于2025年审议通过了《
- 2026-02-10
- 8
-
9.缓粘结钢绞线 特朗普或于明年初公布新任美联储主席提名人选
- 9

- 缓粘结钢绞线 特朗普或于明年初公布新任美联储主席提名人选
- 2025-12-29
- 9
-
10.缓粘结钢绞线 我很可暮夜,尤其是成长为个大东说念主之后。
- 10

- 缓粘结钢绞线 我很可暮夜,尤其是成长为个大东说念主之后。
- 2026-01-25
- 10
推荐资讯
-
缓粘结钢绞线 2014-2015赛季欧洲冠军联赛
2026-01-12
-
缓粘结钢绞线 传奇大作《麻辣农女驭夫记》,经典名场面,傲娇
2026-01-08
-
缓粘结钢绞线 腾讯NBA:打造体育&娱乐融合新范式
2026-01-12
-
15.24钢绞线每米重量 小区会所突然关门,近两百会员游泳无
2026-01-04
-
北京预应力钢绞线价格 30个“双”校新校区,进入大规模建设阶
2026-01-04