医学科研AI模型评测—

医学科研AI模型评测——图片解读

发布时间：2026-06-09 00:16:02 来源：前出塞知识网

作者：医学科研AI模型评测——图片解读

今天国庆节放假第一天，闲来无事，突发奇想我之前一直用AI来帮我阅读文献、总结要点、润色，但是从来没有测试过AI分析科研图片的能力。我们经常读文献遇到看不懂的图片，是否可以直接投喂给AI让他们来帮我们分析？今天我就选取了我发表文章里的一张特别简单的Western图上传到各个AI平台，让他们帮我分析了一下各大AI的表现差距还是蛮大的，具体可以看图。我们科研中应该用哪个AI，也许这个笔记可以给个参考。本次评价都是用的最新的免费模型，至于付费的，也许表现会更好。首先是国内AI： 1、文心一言：和我预想的不大一样，我本以为中规中矩，结果不太理想。文心虽然正确识别了蛋白和处理组，但无法识别条带的深浅，进而无法得出结论，而是让你自己去分析。 2、通义：表现的要比文心一言强，能准确的得出结论，但描述过程比较累赘，不简洁清晰。 3、豆包：表现的出乎意料。本以为豆包是个生活助手，专业的可能弱一些，结果表述的很准确，并得出了清晰的结论。 4、kimi：直接摆烂，无法识图，提示要从2.0切换到1.5，切换之后表现的也不行。 5、智谱清言：一直听说是国家队的，所以加了进来。果然表现的不错，与豆包不相上下，但其识别出了处理组和对照组。 6、元宝（Deepseek）：一直以为DS是第一梯队，结果大失所望，主要近期是太能胡言乱语，竟然识别出了4个组，这是根本性的错误。不过结论还是对的。再来看看国外的AI： 1、chatgpt：无敌了，果然法拉利还是法拉利。整体描述言简意赅，逻辑清晰，分组描述相当准确，结论清晰准确，没有半句废话。更可怕的是他还问你要不要给你写个图注！太贴心了。 2、Gemini：还好还好，发挥正常。 3、Grok：马斯克还是不行，可以说是表现最差的，竟然无法识别出MSC。也无法识别条带深浅。总结：综合来看，单单就这次结果来看，国内豆包和智谱清言表现优秀，值得后续继续评测。国外的话还是gpt无敌，gemini尚可。当然单单一次实验没法全面的评测模型的科研综合能力，也欢迎大家一起加入进来对模型进行评价，找出适合我们医学生的AI模型。#大模型 #科研学习 #生物医学科研

返回新闻列表

文章详情

医学科研AI模型评测——图片解读

推荐阅读