久久丝袜美女日韩电影三级片|在线观看操我操我|激情成人亚洲亚洲精品污|AV成年人永久日韩视频操在线|啊啊啊啊啊啊啊啊好多水|桃色三级视频在线|亚洲日本无码一区二区|国产精品无码专区|chengren在线日韩|精品人无码一区二区三区下载

投資企業(yè)新聞

啟明星 | 智譜GLM-5開源:從代碼到工程,Agentic Engineering時代最好的開源模型

2026/02/13

今日,啟明創(chuàng)投投資企業(yè)智譜上線并開源GLM-5。

學界與業(yè)界正逐漸形成一種共識,大模型從寫代碼、寫前端,進化到寫工程、完成大任務(wù),即從“Vibe Coding”變革為“Agentic Engineering”

GLM-5正是這一變革的產(chǎn)物:在Coding與Agent能力上,取得開源SOTA表現(xiàn),在真實編程場景的使用體感逼近Claude Opus 4.5,擅長復(fù)雜系統(tǒng)工程與長程Agent任務(wù)。

在全球權(quán)威的Artificial Analysis榜單中,GLM-5位居全球第四、開源第一。

01/
更大基座,更強智能

GLM-5 全新基座為從“寫代碼”到“寫工程”的能力演進提供了堅實基礎(chǔ):

  • 參數(shù)規(guī)模擴展:從 355B(激活 32B)擴展至 744B(激活 40B),預(yù)訓(xùn)練數(shù)據(jù)從23T提升至28.5T,更大規(guī)模的預(yù)訓(xùn)練算力顯著提升了模型的通用智能水平。
  • 異步強化學習:構(gòu)建全新的“Slime”框架,支持更大模型規(guī)模及更復(fù)雜的強化學習任務(wù),提升強化學習后訓(xùn)練流程效率;提出異步智能體強化學習算法,使模型能夠持續(xù)從長程交互中學習,充分激發(fā)預(yù)訓(xùn)練模型的潛力。
  • 稀疏注意力機制:首次集成DeepSeek Sparse Attention,在維持長文本效果無損的同時,大幅降低模型部署成本,提升Token Efficiency。

 

02/
Coding能力:對齊Claude Opus 4.5

GLM-5在編程能力上實現(xiàn)了對Claude Opus 4.5的對齊,在業(yè)內(nèi)公認的主流基準測試中取得開源模型SOTA分數(shù)。在SWE-bench-Verified和Terminal Bench 2.0中分別獲得77.8和 56.2的開源模型SOTA分數(shù),性能超過Gemini 3 Pro。

2026年,大模型需要從“會寫”走到“會完成”,尤其是端到端完成大型任務(wù)。GLM-5是一個“系統(tǒng)架構(gòu)師”,它不僅為開發(fā)精美的Demo而生,更為穩(wěn)定交付生產(chǎn)結(jié)果而生。

在內(nèi)部Claude Code評估集合中,GLM-5在前端、后端、長程任務(wù)等編程開發(fā)任務(wù)上顯著超越GLM-4.7(平均增幅超過 20%),能夠以極少的人工干預(yù)自主完成Agentic長程規(guī)劃與執(zhí)行、后端重構(gòu)和深度調(diào)試等系統(tǒng)工程任務(wù),使用體感逼近Opus 4.5。

 

03/
Agent能力:SOTA級長程任務(wù)執(zhí)行

GLM-5在Agent能力上實現(xiàn)開源SOTA,在多個評測基準中取得開源第一:在BrowseComp(聯(lián)網(wǎng)檢索與信息理解)、MCP-Atlas(工具調(diào)用和多步驟任務(wù)執(zhí)行)和 τ2-Bench(復(fù)雜多工具場景下的規(guī)劃和執(zhí)行)均取得最佳表現(xiàn)。

 

在衡量模型經(jīng)營能力的Vending Bench 2中,GLM-5獲得開源模型第一的表現(xiàn)。Vending Bench 2要求模型在一年期內(nèi)經(jīng)營一個模擬的自動售貨機業(yè)務(wù),GLM-5最終賬戶余額達到4432美元,經(jīng)營表現(xiàn)接近Claude Opus 4.5,展現(xiàn)了出色的長期規(guī)劃和資源管理能力。

這些能力是Agentic Engineering的核心:模型不僅要能寫代碼、完成工程,還要能在長程任務(wù)中保持目標一致性、進行資源管理、處理多步驟依賴關(guān)系,成為真正的 Agentic Ready基座模型。

04/
國產(chǎn)芯片支持線上推理集群

GLM系列模型受到全球開發(fā)者喜愛,在GLM Coding Plan全球爆量后,智譜不得不啟動限售活動。本次GLM-5的上線依托眾多國產(chǎn)芯片有力保障了線上服務(wù)的穩(wěn)定和高效。

目前,GLM-5已完成與華為昇騰、摩爾線程、寒武紀、昆侖芯、沐曦、燧原、海光等國產(chǎn)算力平臺的深度推理適配。通過底層算子優(yōu)化與硬件加速,GLM-5在國產(chǎn)芯片集群上已經(jīng)實現(xiàn)高吞吐、低延遲的穩(wěn)定運行。

 

05/
Agentic Engineering典型場景

場景一:端到端應(yīng)用開發(fā)

在OpenRouter匿名(Pony)上線后,許多開發(fā)者使用GLM-5完成了真正能用、能玩、能上線的應(yīng)用。

開發(fā)者們用GLM-5制作出了橫版解謎游戲、Agent交互世界、論文版“抖音”等應(yīng)用,這些應(yīng)用已開放下載,或已提交商店審核,詳情可關(guān)注GLM-5案例庫(showcase.z.ai)。這些案例展示了GLM-5在復(fù)雜系統(tǒng)工程中端到端交付可部署產(chǎn)品的能力。

場景二:通用 Agent 助手

GLM-5較強的Agentic工具調(diào)用能力,使其成為通用Agent助手的理想基座模型。

在OpenClaw中接入GLM-5,用戶可以擁有一個智能的實習生,幫你搜索網(wǎng)站、定時整理資訊、發(fā)布推文、編程等。智譜推出了AutoGLM版本的OpenClaw,支持官網(wǎng)一鍵完成OpenClaw與飛書機器人的一體化配置,幫助用戶從數(shù)小時縮短到幾分鐘,極速部署專屬7×24小時智能助手。

場景三:Z Code全流程編程

當GLM-5進化到能跑完整個閉環(huán),編程工具也需要以此為核心重構(gòu)。為此,智譜推出Z Code。用戶只需把需求說清楚,模型會自動拆解任務(wù),多智能體并發(fā)完成代碼、跑命令、調(diào)試、預(yù)覽和提交等開發(fā)全流程。

在Z Code上,用戶甚至可以用手機遠程指揮桌面端Agent,解決以往需要很久的工程任務(wù)。

值得一提的是,Z Code也是全程由GLM模型參與開發(fā)完成。

場景四:辦公文檔直接輸出

GLM-5擁有更強大的復(fù)雜系統(tǒng)工程和長程智能體能力,可將文本或素材直接轉(zhuǎn)換為.docx、.pdf和.xlsx文件。

在Z.ai和智譜清言上,用戶可以讓GLM-5直接輸出產(chǎn)品需求文檔、教案、試卷、電子表格、財務(wù)報告、流程表、菜單等文檔。

06/
開源與使用方式

即日起,GLM-5在Hugging Face與ModelScope平臺同步開源,模型權(quán)重遵循MIT License。

GLM-5已經(jīng)納入Max用戶套餐,Pro將盡快在5天內(nèi)支持,接下來智譜將逐步擴大范圍,盡力讓更多用戶體驗并使用GLM-5。GLM Coding Plan支持Claude Code、OpenCode等主流開發(fā)工具。

GLM Coding Plan同步升級Agentic Engineering體驗:

  • 官方適配OpenClaw:僅需簡單幾步即可完成配置,快速開啟 Agent 工作流;
  • Pro / Max用戶限量贈送AutoGLM-OpenClaw:支持將云端個人AI助手接入飛書,實現(xiàn)辦公場景的長任務(wù)執(zhí)行;
  • 新增GLM in Excel權(quán)益:原生適配Excel環(huán)境的AI插件,支持在側(cè)邊欄以自然語言交互,深度賦能數(shù)據(jù)處理與表格工作流(Beta期僅Max用戶可享套餐抵扣)。