LMArena 刚更新了榜单, 百度的文心大模型 5.0-preview 上榜了! 而且是全球第二! 从测试数据上看创意写作和长上下文测试分数非常高, 这意味着召回性能会很好. 注意看我的截图, 创意写作, 指令遵循, 长Query这三个, 甚至比GPT-5要高! 好奇这次百度的文心大模型的实际效果, 稍后我会为大家带来测试, 另外强烈建议关注下召回能力, 从这个得分来看召回会不错, 这会让文本任务例如写报告, 解读文档, 整理资料等都会很好 另外现在其实已经可以用了, LMArena 上面给了测试入口. 不过我刷了一圈看样子是要在13号的百度世界正式发布. 目前还没放出这个模型的技术报告, 等一波发布. #文心一言 #ERNIE #百度 #大语言模型 #LLM