Sections
LLM
26 篇收录在 LLM。
Ring-1T
Ring-1T:首个万亿参数开源思考模型,采用MoE架构(1T总参数,50B激活),通过IcePoP稳定RL训练、C3PO++优化长尾生成、ASystem框架突破系统瓶颈,在AIME-2025等基准上取得突破性成果。
GLM-4.5
GLM-4.5:采用MoE架构(355B总参数,32B激活)的混合推理模型,聚焦Agentic、Reasoning和Coding,支持思考与非思考双模式,在AIME 24上达91.0%、SWE-bench Verified上达64.2%。
MiniMax-M1
MiniMax-M1:基于Lightning Attention的MoE模型(456B总参数,45.9B激活),提出CISPO算法提升RL训练效率,支持80K长上下文推理,在复杂软件工程和工具利用任务上表现突出。
Skywork-OR1
Skywork-OR1:基于DeepSeek-R1-Distill的高效强化学习推理模型,提出MAGIC训练方法(多阶段自适应熵GRPO),深入分析entropy崩塌现象,在AIME基准上超越DeepSeek-R1。
























