8月份的SuperCLUE-VLM榜单不知道大家看了没有,文心4.5 Turbo VL拿了多模态模型国产第一。 看完榜单,我也惯例去X上溜了一圈,看看海外网友们的评价。 发现关于这个模型,有张图挺火,就这张,实话说以一般人的角度来看,我不太清楚这是什么后现代艺术,有点抽象啊!看不懂一点。 但是这个模型居然能有理有据的分析出来,这让我觉得还挺有意思,所以我查了很多关于这个模型的资料, 我发现它在视觉推理层面上,确实挺不错的。应用场景也比较多,我就不和大家说什么拍照上传孩子的英文课本,直接生成脑图这种常规操作了。 除了对艺术品进行描述外,最让我惊喜的有两个功能,我跟大家仔细说说。 第一是对中国传统文化的一些复刻,文心4.5 Turbo VL可以对小篆,隶属等多种字体进行识别,以及对一些文物模型进行识别,比如这个三星堆。 这功能对文物考察工作方面实在是很有帮助,能够大大的降低对文物的损耗,因为很多考古工作者在工作的时候要对文物进行挖掘,识别,在清理的时候,难免一个手抖,文物可能就有损坏的风险。 现在只需要拍张照片,就能帮助到他们,妈妈再也不用担心我手抖了!! 第二个是视频内容时序定位,这对于我这样的博主来讲确实是大大的利好。 我认为做视频,难的不是写文案,而是找素材,这能花我一半以上的时间,文心4.5 Turbo VL能很好的帮我解决这一点,我试了一下,你只要上传一段视频,和它说你想要找的片段,并且附上需要片段特点。 他就可以帮你自动识别,然后你就直接开剪就完了,还挺高效的。 还有大家最关心的具体模型水平,我也看了下详细的对比数据,和排名第一的海外模型相比,其实差距也比较小,日常使用起来差别不大,推荐大家试一试,文心4.5 Turbo VL多模态还挺强的! #ai #文心一言 #多模态 #ai工具 #大模型 #学习 #人工智能