2025年07月29日
开源大模型 · 最新文章
国产 AI 王炸!智谱 GLM-4.5 开源:参数砍半性能反超,API 价格仅 Claude 1/10
GLM-4.5最引人瞩目的,是其混合专家(MoE)架构带来的参数效率革命。模型总参数量达3550亿,但单次推理仅激活320亿参数——相当于用"全科医生+专科医生"的协作模式,既保证了知识广度,又提升了任务精度。
宣布推出 Qwen3,这是 Qwen 系列大型语言模型的最新成员。我们的旗舰模型 Qwen3-235B-A22B 在代码、数学、通用能力等基准测试中,与 DeepSeek-R1、o1、o3-mini、Grok-3 和 Gemini-2.5-Pro 等顶级模型相比,表现出极具竞争力的结果。此外,小型 MoE 模型 Qwen3-30B-A3B 的激活参数数量是 QwQ-32B 的 10%,表现更胜一筹,甚至像 Qwen3-4B 这样的小模型也能匹敌 Qwen2.5-72B-Instruct 的性能。
2025年04月29日