刚看到个消息,DeepSeek V4今天正式开源了,双版本同时发布。 我翻了翻技术社区的讨论,有意思的不是参数有多大,是它跑起来更省成本了。 两个版本分工清晰,Pro版本主打硬核任务,Agent能力在开源模型里排第一,知识推理和代码任务上部分指标已经接近Claude Opus 4.6 Max。Flash版本走轻量路线,日常任务跟Pro差不多,复杂任务才有差距。两个版本都支持100万tokens上下文,输出最长384K。 参数堆到万亿级已经不稀奇了,稀奇的是它在长文本上的成本降下来了。官方数据显示,在1M上下文下,V4的算力消耗比前代V3降低了73%。处理长文档、长对话的成本不再那么高了,这对做应用的开发者是个好消息。 架构上也有几个新变化,注意力机制用了压缩方案,MoE专家数量比前代更多,每次激活6个。优化器和残差连接也换了,训练更稳定。 这次对Agent场景做了专门适配,简单对话走“非思考模式”,复杂任务切“思考模式”,还能调思考强度。开发者可以按实际情况来,避免简单问题也消耗大量算力,有开发者实测反馈,复杂场景下的体验比Sonnet 4.5还要好。 另一个值得注意的信号,V4原生适配了昇腾芯片,底层代码从英伟达的CUDA迁移到了华为的CANN架构。寒武纪等厂商也完成了“Day 0”适配,代码已经开源。这意味着国内大模型在性能上实现了算力链的自主闭环,不用再依赖英伟达的生态。Apache 2.0协议随便用,随便改。 参数更大,跑起来更省,国产算力直接能用,信号挺清楚的。开源大模型赛道,卷完参数开始卷效率了。 #DeepSeek #DeepSeekV4 #开源大模型 #AI大模型 #国产算力