先说事儿,文心5.1 Preview拿下文本榜国产第一了。 LMArena最新的排名刚更,文心5.1 Preview拿了1476分,直接冲上文本榜国内第一,而且还是榜单前十五名里,唯一的国产模型,这点是真的厉害。 说实话,现在大家都盯着代码榜、推理榜看,刷到文本榜的排名,大概率会随手划走。 但我反而觉得,文本榜才更该好好说说,不管大模型说得多花哨,不管是写代码、做推理,还是搞多模态,底子其实都是文本能力撑起来的。 写代码的逻辑、拆任务的思路,还有回答问题的条理,说白了都是靠文本建模在托底。底子不牢,后面那些的能力,其实都是空中楼阁,站不住脚的。 这一轮排名里,文心5.1 Preview的文本分数,超过了DeepSeek-V4-Pro、GPT-5.5这些大家常听的模型。 不是说DeepSeek不强哈,毕竟它刚发布的时候,大家都抢着测,效果确实能打。只能说,在文本这个基本功赛道上,文心这次确实发挥得更好,交出了一份更亮眼的答卷。 另一个关键信息是,文心这次进步这么大,用了一个叫“弹性训练”的技术,能一次训练生成多种规模模型,而且成本是业界同规模模型的6%,一个简单的成本算术题就能知道效果有多好。 其实也能理解,百度在这块,已经沉下心做了十几年,不是谁突然变弱了,而是有人一直没停下脚步罢了。 文心5.1 Preview已经上线百度千帆模型广场了,开发者和企业用户可以去申请邀测。而且确切有消息,5月份的百度Create大会上,文心5.1就要正式亮相了。 我已经打算去千帆申请个API试试水,看看它这“文本基本功”到底厉害在哪,实测一下,后续再跟大家分享~ #百度 #文心 #文心大模型 #百度Create大会2026 #Deepseek #deepseekv4 #ai