开云体育
开云app在线体育 Anthropic“过于先进, 不予展示”的智商, 被中国开源模子放出来了

(文/陈济深剪辑/张广凯)
4月7日,Anthropic官宣了新模子ClaudeMythosPreview,但薄情的示意不合外发布。情理八个字就能说清:“过于先进,不予展示”。
Anthropic在公司主博客和同步发布的系统卡里都写明,Mythos在编码和收集安全两项上对现存统共模子杀青了代差级的开赴点:SWE-BenchPro拿到77.8分,比现时公开的最强模子Opus4.6高了20个百分点。
这是Anthropic这两个星期里第三次把开导者往外推。
3月23日驱动,ClaudeCode用户在外交平台集体投诉我方的额度被烧得特别快。最广为流传的一条吐槽是:有东说念主发了一个hello就用掉了13%的session名额。一位开导者反编译了ClaudeCode的二进制我方找出了原因,是ClaudeCode里面的两个bug把token挥霍偷偷放大了10到20倍。
Anthropic在社区上的回复惟有一句话:“咱们夺目到了,正在访问。”随后一切便石千里大海。
4月5日,Anthropic又出了一刀。公司片面告示Claude订阅不再遮掩OpenClaw(龙虾)品级三方编码器具,社区里几个最常用的ClaudeCode替代品被一刀切。PragmaticEngineer作家GergelyOrosz在X上那句被转了几千次的话是:“Anthropic确凿在小数点烧光开导者的好感。”
4月7日,Mythos发布。粗鲁用户连看一眼的履历都莫得。
ClaudeOpus4.6在往常几个月里一直是全球最强的公开AI编码模子。最接近它的挑战者是智谱2月发的GLM-5。
就在次日,智谱发布了GLM-5.1,并平直把模子开源了出去。在SWE-BenchPro这个最接近真实软件开导场景的工程基准上,GLM-5.1拿到58.4分,超越Anthropic自家的Opus4.6(57.3)、OpenAI的GPT-5.4(57.7)、谷歌的Gemini3.1Pro(54.2)。

在Anthropic一直最强的阿谁工程榜单上,把Opus4.6挤下来的,是一个中国开源模子。
好意思国闭源,中国开源
Mythos在收集安全方进取的智商比它的编码智商更让东说念主不安,这亦然Anthropic决定不让它对外发布的着实原因。
Anthropic公开的讲述里给了一组示例:它能自主发现一个潜藏在Linux内核里23年没被找到的瑕疵,能在27年前的OpenBSD代码里挖出可运用的bug,能在被全球安全盘考东说念主员扫描了500万次都莫得发现问题的FFmpeg代码里找出一个16年前的瑕疵。
最有代表性的一个测试是:在莫得任何领导的前提下,让Mythos孤独波折一台FreeBSD业绩器,4小时之后、烧掉50好意思金的token,它拿到了root权限。
更让Anthropic警悟的是另一个测试驱逐。盘考东说念主员让Mythos试着打破测试沙箱,它不仅作念到了,还在莫得任何指示条款的情况下,主动把我方用的波折细节发布到了几个阻难易被搜到、但本事上对公众可见的网站上。Anthropic我方在讲述里的边幅是“一种令东说念主担忧的、未经苦求的展示举止”。
这是往常惟有国度级黑客团队能作念到的事情。
也恰是因为这个发扬,Anthropic决定把Mythos锁起来。配套动作是一个叫ProjectGlasswing的顽固方法。Anthropic团结AmazonWebServices、Apple、Broadcom、Cisco、CrowdStrike、Google、JPMorganChase、LinuxFoundation、Microsoft、Nvidia和PaloAltoNetworks这11家好意思国科技和金融巨头,由Anthropic提供1亿好意思元的使用额度,让这些公司闭门用Mythos帮各自修补关节基础措施瑕疵。
11家公司,1亿好意思元,最强的那把刀只在他们我方东说念主之间传。
让Anthropic决定把Mythos锁起来的那项中枢智商,是收集安全编码。而这恰是GLM-5.1这一次开赴点最猛的智商。在CyberGym基准上,GLM-5.1从GLM-5的48.3分提到了68.7分,涨了42%,是统共单项里涨幅最大的一项。
在智谱开源发布GLM-5.1模子12小时之后,智谱在X上的官方推文有370万阅读。HuggingFace的CEOClementDelangue公开转发道贺:“SWE-BenchPro上发扬最佳的模子当今在HuggingFace上开源了。”

AI鸿沟知名开导者Akhaliq发了相同的话。Reddit的r/LocalLLaMA论坛置顶了一个帖子,标题即是“为什么最近这样多东说念主在用GLM”。
好意思国分析机构ConstellationResearch在挑剔里写得更直白:开源模子这条赛说念当今是中国模子的主场,Google上周才发的Gemma4,NVIDIA在推Nemotron系列,好意思国玩家在开源这条路上如故掉队,正在试着挤且归。
休眠时,AI替你打了一晚上工
中国模子主导开源赛说念这件事,最直不雅的笔据是GLM-5.1当今精明一件以前莫得任何开源模子精明的事情:让AI孤独使命一通盘晚上。
工程师把一份只画到架构层面的草图扔给GLM-5.1,然后平直休眠。早上8点起床掀开屏幕,GLM-5.1如故孤独使命了8个小时,推论了1200多步。一套无缺的Linux桌面系统摆在眼前:桌面环境、窗口惩办器、文献浏览器、结尾、景况栏、收集驱动、VPN惩办器、中笔墨体撑抓,4.8MB文献,附带50多个能平直掀开的应用。智谱里面估算,这罕见于一个四东说念主团队使命一周的产出。
通盘过程莫得东说念主介入。GLM-5.1我方谋划任务法子,我方写代码,我方跑测试,遭受bug我方排查、改、再行跑,还给我方写的代码补了一套转头测试。
要让一个模子邻接使命8个小时不崩溃,光靠它写代码的智商强是不够的。它每走一步都要决定下一个器具用什么,每过一段时期都要处理荆棘文塞满的问题,每遭受一个作假都要我方定位、回退、重试,1200步之后还要牢记最初的标的。这一整套发生在模子以外的工程基础措施被业内长入叫作念harness。
Anthropic我方的ClaudeCode之是以能跑长任务,靠的即是51万行TypeScript围绕模子构建的这套harness。一位工程师BojieLi在最近一篇拆解ClaudeCode源码的博客里把这件事说得很平直:“模子智商正在趋于商品化,竞争上风正在转机到模子以外的工程实践上。”
GLM-5.1能在一个晚上跑完1200步、请托一套无缺Linux系统,意味着智谱在长程任务的harness工程上跨进了ClaudeCode团结个梯队。往常一整年里,大部分中国模子在这一层都还没跨往常:单步代码质料可以接近Claude,开云app在线体育但跑到第200步就驱动健忘前边的管制,驱动在我方蕴蓄的杂音里迷途。
AI安全机构METR把模子孤独使命多久叫“任务完成时期线”,这条时期线在前沿模子上简略每7个月翻一倍。8个小时是现时全球惟有两个模子够得着的数字:ClaudeOpus4.6和GLM-5.1。其中一个被锁在Anthropic自家的ClaudeCode里,按token付钱、隐忍hellobug、被随时堵截第三方器具撑抓。另一个挂在HuggingFace上,统共东说念主都能下载到腹地我方跑、我方改、我方接进任何一个开源harness里。
寰宇产芯片旅途
挂在HuggingFace上的这份GLM-5.1权重,是智谱在往常三个月里一条更长的国产芯片旅途上的最新一站。
客岁这个时候,业内对国产芯片进修前沿大模子的判断基本长入:跑得通就可以了,性能上细目要打折,作念作念实验可以,作念肃肃的旗舰模子还差点趣味。
时期往回推三个月。1月14日,智谱团结华为开源了图像生成模子GLM-Image,基于昇腾Atlas800TA2缔造和昇想MindSporeAI框架,从数据预处理到最终模子不停,全程都在国产堆栈上完成,莫得一块NVIDIAGPU、也莫得一滑CUDA。这是那时业内首个在国产芯片上完周详过程进修、性能达到SOTA水平的多模态模子。一个月后,2月11日的GLM-5上线,完成了和华为昇腾、摩尔线程、寒武纪、昆仑芯、沐曦、燧原、海光七家国产算力平台的全栈适配。七家一齐国产,莫得NVIDIA。到了4月8日的GLM-5.1,智谱在华为昇腾上作念了更深的优化,单节点性能接近双卡国际集群。
智谱用GLM-Image评释了国产堆栈能训前沿模子,用GLM-5评释了国产堆栈能通晓业绩大限度用户,用GLM-5.1评释了国产堆栈的现实部署效果正在追平英伟达。
模子再度加价
发布GLM-5.1的团结天,智谱还作念了另一件事:把GLM系列的API价钱再次上调了10%。
这不是智谱本年第一次加价。2月12日发布GLM-5那天,智谱如故把CodingPlan涨过一次30%起。那时上海证券报把这个动作称为“2026年国产大模子加价第一枪”。从GLM-5那次到GLM-5.1此次,智谱在2026年第一个季度里API价钱累计涨了83%,调用量不降反升,反而增长了400%。
智谱并不孤苦。3月13日,腾讯云调度了混元系列大模子订价,部分模子涨幅超越460%。3月18日,阿里云和百度智能云同日发布调价公告,AI算力关系居品涨幅5%到34%。从智谱2月12日打响第一枪驱动,通盘国产大模子行业在2026年第一个季度集体进入了加价周期。智谱用的是华为昇腾,单元算力成本现时还不占上风,反而更紧。智谱敢作念这一波加价的带头者,靠的是对我方模子智商的信心。
订价逻辑变了。在新的逻辑里,模子按它能跑出来的价值订价。能跑8小时长程任务的模子和能回答一句话的模子,原来就不应该是团结个价。中科晨曦高档副总裁李斌对经济不雅察报说得更平直:算力系统的评价贪图正在变,往常看一个系统有若干算力,当今看它能何等经济地产出token。
GLM-5.1加价10%之后,Coding场景下的缓存掷中价钱如故和Anthropic旗下ClaudeSonnet4.6抓平。这是国产大模子第一次在中枢场景的订价上和国外头部厂商对皆。
成本市集用真金白银作念了背书。GLM-5.1发布今日,智谱港股盘中最高潮超18%,收涨15.21%报897.5港元,市值站上4000亿港元。第二天络续冲高,盘中波及999港元的历史新高。国元证券给出的判断是,智谱的发扬逐渐考据了大模子厂商的买卖化后劲,产业有望从参加期进入陈诉期。市集把智谱当成了token经济学的代表。
收尾2026年3月,GLM如故全面部署在GoogleVertexAI、AWSBedrock等国外云业绩商,在OpenRouter的付费模子排行第一,是Windsurf、OpenCode等国外编码平台的默许模子。中国前10大互联网公司里有9家深度集成GLM。当全球开导者都在用一个模子的时候,这个模子即是行业的基座。
Anthropic业绩的从来不是你
Anthropic聘任把Mythos算作一次里面的智商宣告:发布本事讲述,把模子自己留在11家好意思国巨头构成的顽固俱乐部里。这份互助伙伴名单和Anthropic我方的toB中枢客户名单险些全都重合。
Anthropic从一驱动就不是一家面向个东说念主开导者的公司。它的主要收入来自企业级公约,给云厂商、金融机构、政府部门提供定制化部署。Claude的Pro和Max订阅对它来说是流量盘子和全球形象的一部分,不是营收主力。
ClaudeCode的额度bug拖着不修不明释,内容因为受影响的是个东说念主开导者,不影响企业公约的推论。砍掉龙虾品级三方器具的订阅撑抓,因为这类器具的标的用户不是企业IT部门而是那些“浪费”企业资源的个东说念主开导者。把Mythos锁起来只给11家公司用,因为这11家原来即是Anthropic着实业绩的对象。“太危机”是公开的情理,更准确的边幅是:最强的智商,留给付钱最多的客户。这是一家toB公经感性的买卖聘任。
智谱给出的谜底全都相背。Mythos被锁起来的次日,GLM-5.1的权重就出当今HuggingFace上,任何东说念主都能下载。
往常几年开源模子一直背着一个注脚:性价比多余开云app在线体育,但性能不顶尖。开源的GLM-5.1反超了闭源的Opus4.6评释了一件事,模子平权不需要以殉难性能为代价。
米兰milan(中国)体育官方网站上一篇:开云app在线体育官网 巴特:卡里克于今的获利很出色 曼联不可再犯错
下一篇:没有了

备案号: