开云app在线体育官网

热点资讯

开云体育

你的位置：开云app在线体育官网 > 开云体育 >

开云app在线体育 Anthropic“过于先进, 不予展示”的智商, 被中国开源模子放出来了

发布日期：2026-04-11 09:20 点击次数：177

开云app在线体育 Anthropic“过于先进，不予展示”的智商，被中国开源模子放出来了

（文/陈济深剪辑/张广凯）

4月7日，Anthropic官宣了新模子ClaudeMythosPreview，但薄情的示意不合外发布。情理八个字就能说清：“过于先进，不予展示”。

Anthropic在公司主博客和同步发布的系统卡里都写明，Mythos在编码和收集安全两项上对现存统共模子杀青了代差级的开赴点：SWE-BenchPro拿到77.8分，比现时公开的最强模子Opus4.6高了20个百分点。

这是Anthropic这两个星期里第三次把开导者往外推。

3月23日驱动，ClaudeCode用户在外交平台集体投诉我方的额度被烧得特别快。最广为流传的一条吐槽是：有东说念主发了一个hello就用掉了13%的session名额。一位开导者反编译了ClaudeCode的二进制我方找出了原因，是ClaudeCode里面的两个bug把token挥霍偷偷放大了10到20倍。

Anthropic在社区上的回复惟有一句话：“咱们夺目到了，正在访问。”随后一切便石千里大海。

4月5日，Anthropic又出了一刀。公司片面告示Claude订阅不再遮掩OpenClaw（龙虾）品级三方编码器具，社区里几个最常用的ClaudeCode替代品被一刀切。PragmaticEngineer作家GergelyOrosz在X上那句被转了几千次的话是：“Anthropic确凿在小数点烧光开导者的好感。”

4月7日，Mythos发布。粗鲁用户连看一眼的履历都莫得。

ClaudeOpus4.6在往常几个月里一直是全球最强的公开AI编码模子。最接近它的挑战者是智谱2月发的GLM-5。

就在次日，智谱发布了GLM-5.1，并平直把模子开源了出去。在SWE-BenchPro这个最接近真实软件开导场景的工程基准上，GLM-5.1拿到58.4分，超越Anthropic自家的Opus4.6（57.3）、OpenAI的GPT-5.4（57.7）、谷歌的Gemini3.1Pro（54.2）。

在Anthropic一直最强的阿谁工程榜单上，把Opus4.6挤下来的，是一个中国开源模子。

好意思国闭源，中国开源

Mythos在收集安全方进取的智商比它的编码智商更让东说念主不安，这亦然Anthropic决定不让它对外发布的着实原因。

Anthropic公开的讲述里给了一组示例：它能自主发现一个潜藏在Linux内核里23年没被找到的瑕疵，能在27年前的OpenBSD代码里挖出可运用的bug，能在被全球安全盘考东说念主员扫描了500万次都莫得发现问题的FFmpeg代码里找出一个16年前的瑕疵。

最有代表性的一个测试是：在莫得任何领导的前提下，让Mythos孤独波折一台FreeBSD业绩器，4小时之后、烧掉50好意思金的token，它拿到了root权限。

更让Anthropic警悟的是另一个测试驱逐。盘考东说念主员让Mythos试着打破测试沙箱，它不仅作念到了，还在莫得任何指示条款的情况下，主动把我方用的波折细节发布到了几个阻难易被搜到、但本事上对公众可见的网站上。Anthropic我方在讲述里的边幅是“一种令东说念主担忧的、未经苦求的展示举止”。

这是往常惟有国度级黑客团队能作念到的事情。

也恰是因为这个发扬，Anthropic决定把Mythos锁起来。配套动作是一个叫ProjectGlasswing的顽固方法。Anthropic团结AmazonWebServices、Apple、Broadcom、Cisco、CrowdStrike、Google、JPMorganChase、LinuxFoundation、Microsoft、Nvidia和PaloAltoNetworks这11家好意思国科技和金融巨头，由Anthropic提供1亿好意思元的使用额度，让这些公司闭门用Mythos帮各自修补关节基础措施瑕疵。

11家公司，1亿好意思元，最强的那把刀只在他们我方东说念主之间传。

让Anthropic决定把Mythos锁起来的那项中枢智商，是收集安全编码。而这恰是GLM-5.1这一次开赴点最猛的智商。在CyberGym基准上，GLM-5.1从GLM-5的48.3分提到了68.7分，涨了42%，是统共单项里涨幅最大的一项。

在智谱开源发布GLM-5.1模子12小时之后，智谱在X上的官方推文有370万阅读。HuggingFace的CEOClementDelangue公开转发道贺：“SWE-BenchPro上发扬最佳的模子当今在HuggingFace上开源了。”

AI鸿沟知名开导者Akhaliq发了相同的话。Reddit的r/LocalLLaMA论坛置顶了一个帖子，标题即是“为什么最近这样多东说念主在用GLM”。

好意思国分析机构ConstellationResearch在挑剔里写得更直白：开源模子这条赛说念当今是中国模子的主场，Google上周才发的Gemma4，NVIDIA在推Nemotron系列，好意思国玩家在开源这条路上如故掉队，正在试着挤且归。

休眠时，AI替你打了一晚上工

中国模子主导开源赛说念这件事，最直不雅的笔据是GLM-5.1当今精明一件以前莫得任何开源模子精明的事情：让AI孤独使命一通盘晚上。

工程师把一份只画到架构层面的草图扔给GLM-5.1，然后平直休眠。早上8点起床掀开屏幕，GLM-5.1如故孤独使命了8个小时，推论了1200多步。一套无缺的Linux桌面系统摆在眼前：桌面环境、窗口惩办器、文献浏览器、结尾、景况栏、收集驱动、VPN惩办器、中笔墨体撑抓，4.8MB文献，附带50多个能平直掀开的应用。智谱里面估算，这罕见于一个四东说念主团队使命一周的产出。

通盘过程莫得东说念主介入。GLM-5.1我方谋划任务法子，我方写代码，我方跑测试，遭受bug我方排查、改、再行跑，还给我方写的代码补了一套转头测试。

要让一个模子邻接使命8个小时不崩溃，光靠它写代码的智商强是不够的。它每走一步都要决定下一个器具用什么，每过一段时期都要处理荆棘文塞满的问题，每遭受一个作假都要我方定位、回退、重试，1200步之后还要牢记最初的标的。这一整套发生在模子以外的工程基础措施被业内长入叫作念harness。

Anthropic我方的ClaudeCode之是以能跑长任务，靠的即是51万行TypeScript围绕模子构建的这套harness。一位工程师BojieLi在最近一篇拆解ClaudeCode源码的博客里把这件事说得很平直：“模子智商正在趋于商品化，竞争上风正在转机到模子以外的工程实践上。”

GLM-5.1能在一个晚上跑完1200步、请托一套无缺Linux系统，意味着智谱在长程任务的harness工程上跨进了ClaudeCode团结个梯队。往常一整年里，大部分中国模子在这一层都还没跨往常：单步代码质料可以接近Claude，开云app在线体育但跑到第200步就驱动健忘前边的管制，驱动在我方蕴蓄的杂音里迷途。

AI安全机构METR把模子孤独使命多久叫“任务完成时期线”，这条时期线在前沿模子上简略每7个月翻一倍。8个小时是现时全球惟有两个模子够得着的数字：ClaudeOpus4.6和GLM-5.1。其中一个被锁在Anthropic自家的ClaudeCode里，按token付钱、隐忍hellobug、被随时堵截第三方器具撑抓。另一个挂在HuggingFace上，统共东说念主都能下载到腹地我方跑、我方改、我方接进任何一个开源harness里。

寰宇产芯片旅途

挂在HuggingFace上的这份GLM-5.1权重，是智谱在往常三个月里一条更长的国产芯片旅途上的最新一站。

客岁这个时候，业内对国产芯片进修前沿大模子的判断基本长入：跑得通就可以了，性能上细目要打折，作念作念实验可以，作念肃肃的旗舰模子还差点趣味。

时期往回推三个月。1月14日，智谱团结华为开源了图像生成模子GLM-Image，基于昇腾Atlas800TA2缔造和昇想MindSporeAI框架，从数据预处理到最终模子不停，全程都在国产堆栈上完成，莫得一块NVIDIAGPU、也莫得一滑CUDA。这是那时业内首个在国产芯片上完周详过程进修、性能达到SOTA水平的多模态模子。一个月后，2月11日的GLM-5上线，完成了和华为昇腾、摩尔线程、寒武纪、昆仑芯、沐曦、燧原、海光七家国产算力平台的全栈适配。七家一齐国产，莫得NVIDIA。到了4月8日的GLM-5.1，智谱在华为昇腾上作念了更深的优化，单节点性能接近双卡国际集群。

智谱用GLM-Image评释了国产堆栈能训前沿模子，用GLM-5评释了国产堆栈能通晓业绩大限度用户，用GLM-5.1评释了国产堆栈的现实部署效果正在追平英伟达。

模子再度加价

发布GLM-5.1的团结天，智谱还作念了另一件事：把GLM系列的API价钱再次上调了10%。

这不是智谱本年第一次加价。2月12日发布GLM-5那天，智谱如故把CodingPlan涨过一次30%起。那时上海证券报把这个动作称为“2026年国产大模子加价第一枪”。从GLM-5那次到GLM-5.1此次，智谱在2026年第一个季度里API价钱累计涨了83%，调用量不降反升，反而增长了400%。

智谱并不孤苦。3月13日，腾讯云调度了混元系列大模子订价，部分模子涨幅超越460%。3月18日，阿里云和百度智能云同日发布调价公告，AI算力关系居品涨幅5%到34%。从智谱2月12日打响第一枪驱动，通盘国产大模子行业在2026年第一个季度集体进入了加价周期。智谱用的是华为昇腾，单元算力成本现时还不占上风，反而更紧。智谱敢作念这一波加价的带头者，靠的是对我方模子智商的信心。

订价逻辑变了。在新的逻辑里，模子按它能跑出来的价值订价。能跑8小时长程任务的模子和能回答一句话的模子，原来就不应该是团结个价。中科晨曦高档副总裁李斌对经济不雅察报说得更平直：算力系统的评价贪图正在变，往常看一个系统有若干算力，当今看它能何等经济地产出token。

GLM-5.1加价10%之后，Coding场景下的缓存掷中价钱如故和Anthropic旗下ClaudeSonnet4.6抓平。这是国产大模子第一次在中枢场景的订价上和国外头部厂商对皆。

成本市集用真金白银作念了背书。GLM-5.1发布今日，智谱港股盘中最高潮超18%，收涨15.21%报897.5港元，市值站上4000亿港元。第二天络续冲高，盘中波及999港元的历史新高。国元证券给出的判断是，智谱的发扬逐渐考据了大模子厂商的买卖化后劲，产业有望从参加期进入陈诉期。市集把智谱当成了token经济学的代表。

收尾2026年3月，GLM如故全面部署在GoogleVertexAI、AWSBedrock等国外云业绩商，在OpenRouter的付费模子排行第一，是Windsurf、OpenCode等国外编码平台的默许模子。中国前10大互联网公司里有9家深度集成GLM。当全球开导者都在用一个模子的时候，这个模子即是行业的基座。

Anthropic业绩的从来不是你

Anthropic聘任把Mythos算作一次里面的智商宣告：发布本事讲述，把模子自己留在11家好意思国巨头构成的顽固俱乐部里。这份互助伙伴名单和Anthropic我方的toB中枢客户名单险些全都重合。

Anthropic从一驱动就不是一家面向个东说念主开导者的公司。它的主要收入来自企业级公约，给云厂商、金融机构、政府部门提供定制化部署。Claude的Pro和Max订阅对它来说是流量盘子和全球形象的一部分，不是营收主力。

ClaudeCode的额度bug拖着不修不明释，内容因为受影响的是个东说念主开导者，不影响企业公约的推论。砍掉龙虾品级三方器具的订阅撑抓，因为这类器具的标的用户不是企业IT部门而是那些“浪费”企业资源的个东说念主开导者。把Mythos锁起来只给11家公司用，因为这11家原来即是Anthropic着实业绩的对象。“太危机”是公开的情理，更准确的边幅是：最强的智商，留给付钱最多的客户。这是一家toB公经感性的买卖聘任。

智谱给出的谜底全都相背。Mythos被锁起来的次日，GLM-5.1的权重就出当今HuggingFace上，任何东说念主都能下载。

往常几年开源模子一直背着一个注脚：性价比多余开云app在线体育，但性能不顶尖。开源的GLM-5.1反超了闭源的Opus4.6评释了一件事，模子平权不需要以殉难性能为代价。

米兰milan(中国)体育官方网站

上一篇：开云app在线体育官网巴特:卡里克于今的获利很出色曼联不可再犯错

下一篇：没有了