fanfer

Composer 2

Cursor推出的面向agentic软件工程的专用模型，基于Kimi K2.5进行持续预训练与大规模强化学习

fanfer·May 19, 2026·94 min read

智谱GLM-5，744B参数MoE模型，采用DSA稀疏注意力与异步智能体强化学习，实现从vibe coding到agentic engineering的跨越

fanfer·May 12, 2026·49 min read

月之暗面开源多模态智能体模型，原生多模态预训练与Agent Swarm并行智能体框架

fanfer·May 2, 2026·35 min read

小米MiMo-V2-Flash技术报告，309B参数MoE模型，混合注意力架构与多教师在线策略蒸馏

fanfer·Apr 22, 2026·39 min read

DeepSeek-V3.2技术报告，提出DSA稀疏注意力、可扩展强化学习框架与大规模智能体任务合成

fanfer·Apr 12, 2026·16 min read

Ring-1T：首个万亿参数开源思考模型，采用MoE架构（1T总参数，50B激活），通过IcePoP稳定RL训练、C3PO++优化长尾生成、ASystem框架突破系统瓶颈，在AIME-2025等基准上取得突破性成果。

fanfer·Apr 2, 2026·35 min read

GLM-4.5：采用MoE架构（355B总参数，32B激活）的混合推理模型，聚焦Agentic、Reasoning和Coding，支持思考与非思考双模式，在AIME 24上达91.0%、SWE-bench Verified上达64.2%。

fanfer·Mar 23, 2026·23 min read

MiniMax-M1：基于Lightning Attention的MoE模型（456B总参数，45.9B激活），提出CISPO算法提升RL训练效率，支持80K长上下文推理，在复杂软件工程和工具利用任务上表现突出。

fanfer·Mar 13, 2026·15 min read

Ring-lite：基于MoE架构的小型推理模型（16.8B参数，2.75B激活），提出C3PO算法稳定RL训练，采用两阶段训练范式解决多领域数据冲突，在小模型中达到SOTA水平。

fanfer·Mar 4, 2026·51 min read