百度文心 5.1 上线了, 他们宣称将总参数压缩至约 1/3、激活参数压缩至约 1/2,仅使用业界同规模模型约 6% 的预训练成本 预训练和 RL 阶段的成本控制做得很死: ▪️ 弹性预训练:参数压了三分之二,激活参数减半,算下来预训练算力只要业界同规模的 6%。 ▪️ 跑分:AIME 26 (带工具) 冲到了 99.6,Arena 搜索榜国内第一(1223分),Agent 能力也超过了 DeepSeek-V4-Pro。 ▪️ 分离式全异步强化学习:把训练、推理、奖励和 Agent 循环解耦,训推的 KL 散度直接降了 50%。 百度还搞到了一个arena搜索榜的第 4. 在opus 4.6, opus4.7, GPT5.5之后 #ERNIE5_1 #百度文心 #Baidu #AIAgents #LLMs #AI开发