国产 AI 王炸!智谱 GLM-4.5 开源:参数砍半性能反超,API 价格仅 Claude 1/10

首个原生融合推理+代码+智能体的国产大模型,1行指令生成完整网站
7月28日夜,国产AI投下重磅炸弹
当硅谷还在猜测GPT-5的发布时间,中国AI团队已经用实际行动改写了全球大模型格局。7月28日晚间,智谱正式发布新一代旗舰模型GLM-4.5,不仅在Hugging Face与ModelScope平台同步开源,更以"全球第三、国产第一、开源第一"的评测成绩,向世界展示了中国AI的硬实力。
这款专为智能体(AI Agent) 打造的基础模型,首次实现了推理、代码、智能体能力的原生融合。用智谱CEO张鹏的话说:"衡量AGI的第一性原理,是在不损失原有能力的前提下融合更多通用智能能力,GLM-4.5是我们对此理念的首次完整呈现。"
技术突破:参数效率革命,3550亿参数仅激活320亿
GLM-4.5最引人瞩目的,是其混合专家(MoE)架构带来的参数效率革命。模型总参数量达3550亿,但单次推理仅激活320亿参数——相当于用"全科医生+专科医生"的协作模式,既保证了知识广度,又提升了任务精度。
惊人的"小而美":参数减半,性能反超
模型 | 总参数量 | 激活参数 | 综合评测得分 |
---|---|---|---|
GLM-4.5 | 3550亿 | 320亿 | 63.2分(全球第三) |
DeepSeek-R1 | 7000亿 | 500亿 | 55.9分 |
Kimi-K2 | 10000亿 | 800亿 | 53.1分 |
这种架构让GLM-4.5在SWE-bench Verified代码能力榜单上位居性能/参数比帕累托前沿——意味着相同计算资源下,它能完成更多任务。
双模式设计:既当"深思者",又做"行动派"
- 思考模式:处理复杂推理和工具调用,比如规划"从北京到上海的最优旅行方案"
- 非思考模式:实现100 tokens/秒极速响应,聊天回复比人类打字还快
真实能力:从代码到智能体的全栈掌控
1行指令生成完整网站,前端到后端全包办
GLM-4.5的代码能力堪称"全栈开发者噩梦"。只需一句"做一个能搜索的Google风格网站",模型就能自动生成:
- HTML/CSS构建的交互界面
- JavaScript实现的搜索逻辑
- 后端数据库连接代码
实测显示,它能独立开发:
- 类B站网页:支持视频播放+弹幕滚动
- Flappy Bird游戏:包含物理碰撞检测
- 3D神经网络可视化:用Three.js实现动态交互
智能体能力实测:52项任务碾压开源竞品
在智谱设计的6大开发场景52项任务测试中,GLM-4.5表现惊艳:
- 工具调用可靠性:90.6%成功率(超越Kimi-K2的82.3%)
- 任务完成度:87分(满分100,接近Claude-4-Sonnet的92分)
- 代码质量评分:可读性4.7/5分,可维护性4.5/5分
成本颠覆:AI平民化时代来临
价格对比:GLM-4.5 vs 主流模型
模型 | 输入价格(元/百万tokens) | 输出价格(元/百万tokens) |
---|---|---|
GLM-4.5 | 0.8 | 2.0 |
Claude 3 Opus | 108.8 | 536.0 |
GPT-4 Turbo | 15.0 | 30.0 |
相当于Claude的1/136(输入)和1/268(输出)!按每日处理100万tokens计算,年成本可从Claude的20万元降至GLM-4.5的1022元。
开发者福利:50元包月无限调用
智谱同步推出"疯狂星期一"活动:支付50元即可获得API包月无限量调用权,让个人开发者也能玩得起顶级AI模型。
行业影响:AI智能体的中国方案
开源生态:兼容Claude Code,无缝迁移
GLM-4.5深度优化了与主流代码智能体的兼容性,开发者只需两行代码即可将现有Claude Code项目迁移至GLM-4.5,无需重构。
应用前景:这些行业将被彻底改变
- 教育:自动生成带互动习题的课件
- 营销:从文案创作到落地页开发一键完成
- 科研:论文公式自动转代码,实验数据可视化
- 企业服务:客服智能体可自主查询数据库并生成报表
风险提示:合规性需评估
需注意智谱因北京背景被列入美国实体清单,企业级部署前建议咨询合规团队。
立即体验GLM-4.5
- 开源地址:Hugging Face
- 免费体验:智谱清言 或 z.ai
- API文档:智谱开放平台
互动话题:你最想用GLM-4.5实现什么功能?评论区留言,抽3人各送100元API调用额度!
本文数据来源:北京日报客户端、新智元、钛媒体等权威报道
编辑:AI科技前沿编辑部
点赞在看↓,一键分享给开发者朋友!## 技术突破:参数效率革命,3550亿参数仅激活320亿
MoE架构:让AI像医院分诊系统一样高效工作
GLM-4.5采用的混合专家(Mixture of Experts)架构,彻底改变了传统大模型"全参数激活"的低效模式。想象一家拥有128个专科医生的超级医院:当你走进医院,分诊系统会根据你的症状自动匹配最相关的8位专家(而非全部128位)进行会诊。
这种设计带来三重优势:
- 计算效率:单次推理仅激活320亿参数,显存占用降低60%
- 知识广度:128个专家网络分别专精不同领域(代码、数学、逻辑等)
- 学习速度:各专家可独立更新,模型迭代周期缩短至2周
🤖 技术人话:传统大模型像全科医生看所有病,GLM-4.5则是128个专科医生协作,你感冒时不会惊动心脏专家,既高效又专业。
15万亿+8万亿:训练数据的"通识+专业"培养体系
GLM-4.5的训练分为三个阶段,堪称AI界的"博士培养计划":
- 通识教育(15万亿tokens):阅读2010-2025年全网文本,包括7000万篇学术论文、3亿本书籍、10万亿条网页内容
- 专业深造(8万亿tokens):
- 代码专项:40%(含GitHub星标超1万的项目代码)
- 推理专项:30%(200万道数学竞赛题、物理公式推导)
- 智能体专项:30%(多轮对话、工具调用案例)
- 临床实习(强化学习):通过人类反馈优化,像住院医师一样积累实战经验

真实能力:从代码到智能体的全栈掌控
教育行业:10分钟生成交互式课件
北京师范大学教育学部试点显示:
- 教师输入"生成《小学语文》三年级作文课课件"
- GLM-4.5输出包含:
- 3个动画演示(比喻修辞手法可视化)
- 5道互动练习题(即时批改)
- 2篇范文+写作指导思维导图
- 原本需要2小时的备课工作缩短至8分钟
金融行业:智能投研报告自动生成
某头部券商的实测案例:
输入:分析宁德时代2025 Q2财报关键指标,对比行业平均水平,生成投资建议
输出:
1. 核心数据提取(营收/利润/毛利率等12项指标)
2. 可视化图表(近6季度营收增长率折线图)
3. 风险提示(原材料价格波动影响分析)
4. 投资评级:增持(目标价测算逻辑)
整个过程无需人工干预,从数据获取到报告生成仅需18分钟。
医疗行业:病历结构化与辅助诊断
三甲医院试点效果:
- 输入300字手写病历:"患者男性,65岁,主诉胸闷气短3天,既往高血压史..."
- 输出结构化数据:
- 症状提取:胸闷(程度:中度)、气短(持续时间:3天)
- 疑似诊断:冠心病(概率72%)、心力衰竭(概率65%)
- 检查建议:心电图、心肌酶谱、心脏彩超
第三方测评:GLM-4.5真的有那么强?
Datawhale实测:15分钟开发生命游戏
开源社区Datawhale进行的对比测试显示:
评估维度 | GLM-4.5 | Kimi-K2 | Qwen3-Coder |
---|---|---|---|
功能完整性 | 95分 | 88分 | 82分 |
代码注释率 | 92% | 85% | 81% |
开发耗时 | 15分钟 | 22分钟 | 28分钟 |
测试结论:"GLM-4.5生成的代码不仅实现基础规则,还额外添加了细胞模式保存、速度调节功能,代码可维护性评分4.7/5分"。
开发者访谈:从Claude迁移后的效率变化
深圳某SaaS公司CTO李工分享:
"我们将客服智能体从Claude迁移至GLM-4.5后:
- 月均API成本从12万元降至800元(节省99.3%)
- 工具调用成功率从82%提升至90.6%
- 客户问题一次性解决率提高15个百分点"
行业影响:AI智能体的中国方案
开源生态的蝴蝶效应
GLM-4.5的MIT许可证将催生三大创新方向:
- 垂直领域智能体:法律合同审查、专利分析、财务报表审计
- 硬件适配优化:已出现适配昇腾910芯片的轻量化版本,推理速度提升40%
- 教育工具革新:中小学编程教育平台"AI助教",实时生成错题解析
参数效率竞赛改写行业规则
清华大学AI研究院张钹院士评价:
"GLM-4.5证明大模型不必盲目堆参数,通过架构创新和数据质量提升,同样能实现性能突破。这种'参数效率优先'的思路,可能让行业从'参数军备竞赛'转向'智能质量竞争'"。