文章详情

专注互联网科技,赋能企业数字化发展

我问文心:你是百度谢广军 你怎么回应热搜?

作者:我问文心:你是百度谢广军 你怎么回应热搜?

百度这运气,,又一次起大早赶了晚集。好巧不巧,瓜这次在自家高管身上了。 网上看到谢的pyq道歉(图六),索性把这个case当成benchmark,给新出的文心X1测一次。 先直接说我自己认为的结果。文心一言X1的效果一般,虽然百度没公布具体的参数和相关技术细节。看起来像是QwQ32B水平的小模型。 本以为百度已经跻身不错的 推理模型 的行列,但表现低于预期。 正文: 为了更了解文心一言在这个案例下的能力, 我用相同的prompt试了下阿里通义qwq-32B 、DeepSeek-R1 、grok(最近心头爱,顺带一起比了)的回复效果。 目前认为(个人观点,欢迎讨论),R1 > grok > Qwq > X1。 * R1的回复(图二)结构清晰,语言简练,比较老油条。我觉得直接改改,能直接拿来公关了。(真诚,行动,共情都有了) * Grok (图三)回答比较平实,但整体小作文看下来没有太突出的点。不知道是不是中文训练语料不够多的原因, * Qwq(图四)已经透露模型是针对数学代码训练的理工男,加上训练集较小,这样的输出效果也算 ok 的。 * 文心(图五)的回答同样平实,带有点僵硬,比如“我们郑重承诺”等细节。 * 等百度后面公布模型细节,或者开源的时候,再看看当前的能力和参数量、训练成本是否是匹配的。 #deepseek #百度 #谢广军 #文心一言 #热点新闻事件 #热搜 #反向文化冲击

返回新闻列表