文章详情

专注互联网科技,赋能企业数字化发展

医学科研AI模型评测——图片解读

作者:医学科研AI模型评测——图片解读

今天国庆节放假第一天,闲来无事,突发奇想我之前一直用AI来帮我阅读文献、总结要点、润色,但是从来没有测试过AI分析科研图片的能力。我们经常读文献遇到看不懂的图片,是否可以直接投喂给AI让他们来帮我们分析? 今天我就选取了我发表文章里的一张特别简单的Western图上传到各个AI平台,让他们帮我分析了一下 各大AI的表现差距还是蛮大的,具体可以看图。 我们科研中应该用哪个AI,也许这个笔记可以给个参考。本次评价都是用的最新的免费模型,至于付费的,也许表现会更好。 首先是国内AI: 1、文心一言:和我预想的不大一样,我本以为中规中矩,结果不太理想。文心虽然正确识别了蛋白和处理组,但无法识别条带的深浅,进而无法得出结论,而是让你自己去分析。 2、通义:表现的要比文心一言强,能准确的得出结论,但描述过程比较累赘,不简洁清晰。 3、豆包:表现的出乎意料。本以为豆包是个生活助手,专业的可能弱一些,结果表述的很准确,并得出了清晰的结论。 4、kimi:直接摆烂,无法识图,提示要从2.0切换到1.5,切换之后表现的也不行。 5、智谱清言:一直听说是国家队的,所以加了进来。果然表现的不错,与豆包不相上下,但其识别出了处理组和对照组。 6、元宝(Deepseek):一直以为DS是第一梯队,结果大失所望,主要近期是太能胡言乱语,竟然识别出了4个组,这是根本性的错误。不过结论还是对的。 再来看看国外的AI: 1、chatgpt:无敌了,果然法拉利还是法拉利。整体描述言简意赅,逻辑清晰,分组描述相当准确,结论清晰准确,没有半句废话。更可怕的是他还问你要不要给你写个图注!太贴心了。 2、Gemini:还好还好,发挥正常。 3、Grok:马斯克还是不行,可以说是表现最差的,竟然无法识别出MSC。也无法识别条带深浅。 总结:综合来看,单单就这次结果来看,国内豆包和智谱清言表现优秀,值得后续继续评测。国外的话还是gpt无敌,gemini尚可。当然单单一次实验没法全面的评测模型的科研综合能力,也欢迎大家一起加入进来对模型进行评价,找出适合我们医学生的AI模型。#大模型 #科研学习 #生物医学科研

返回新闻列表