DeepSeek V4终于来了,我们知道些什么?

日期:2026-04-28 16:03:35 / 人气:9


万众期待的DeepSeek V4预览版终于在北京时间4月24日上午发布了。此前,媒体和分析师曾反复预测V4即将发布,并已经多次预测失败,这一次终于成功了。由于模型发布时间还太短,第三方和客户评测还在紧锣密鼓的进行中,现在的有效信息其实很少。不过,通过技术文档、海外AI社区的初步讨论以及最新的行业动态,我们还是能得到一些关键情报。
一、核心战略:聚焦Agent能力,贴合“全民养龙虾”潮流
V4的核心战略方向是大幅提升Agent能力,这与OpenClaw发布以来的全球AI发展潮流高度契合。自“全民养龙虾”的浪潮兴起后,MiniMax、Kimi和智谱等国产大模型厂商获得了巨大的Token增量,但其中最核心、最专业的增量却被Claude牢牢占据。
Agent能力与编程能力密不可分,目前Claude Code仍是全球最强大的AI编程工具(没有之一),即便GPT-Codex也无法撼动其地位。DeepSeek官方在公告开头最显眼的位置明确宣称“Agent能力大幅提高”,但也坦诚“(据评测反馈)仍与Opus 4.6思考模式存在一定差距”。
海外AI社区中,有部分用户兴奋地期待DeepSeek V4能成为“Claude杀手”——公允而言,这更多是一种美好愿望,背后藏着“天下苦Anthropic久矣”的行业情绪,许多人对Claude及其开发商Anthropic的垄断地位颇有微词。从目前的测试数据来看,V4的Token性价比优势突出,但Agent Benchmark指标并未超过Claude Opus-4.6和GPT-5.4。
需要注意的是,Benchmark分数仅具有参考意义,实际用户体验才是关键。Claude在许多Benchmark测试中并不优于GPT和Gemini,但这并不妨碍它在Agent领域几乎一枝独秀。因此,接下来一段时间,专业用户使用DeepSeek V4进行Agent操作的实际反馈,将成为判断其竞争力的核心依据。
此外,V4将上下文窗口扩展至1M,这是一项重要提升,结合其较低的Token定价,有望大幅提升生产力。不过,这一优势的实际效果,仍需等待专业客户执行复杂任务后的反馈,预计还需等待两三天才能有初步结论。
结合行业趋势推测,DeepSeek V4从传说中的“1月/2月发布”推迟至4月,大概率是为了打磨Agent能力——“龙虾”这波增量超出了所有人的预期,与其发布一个跟不上现实Agentic Workflow需求的模型,不如多花几个月时间,推出一个完全贴合市场需求的版本。当然,这只是个人猜测,目前尚无实证支撑。
二、用户反馈:非核心场景表现偏“干”,或为降低幻觉率的取舍
从最初一波海外客户的使用反馈来看,V4在执行“非深度推理、非数学、非代码”类任务(如头脑风暴、文艺创作)时,给人的感受偏“干”(dry)、“过于正式”,不仅落后于Claude和GPT的最新版本,甚至有用户认为其表现不及GPT-5.2。
需要强调的是,这些均为零碎的主观感受,不能代表V4的整体实力,且文艺创作本身并非V4的主要发力方向。但即便如此,这种反馈仍有可能对消费端用户的选择倾向造成微妙影响,进而扰动当前互联网大厂在C端AI应用市场的竞争格局。
对此,有一个合理的猜测:V4的“干”与“正式”,或许是为了解决V3/R1版本幻觉率较高的问题。从行业规律来看,AI模型的自由发挥往往会伴随幻觉率上升,而要限制幻觉率,大概率会导致回答变得“更干、更严谨”。这一猜测是否成立,仍需等待更广泛、更全面的测试结果来验证。
三、核心悬念:训练硬件成谜,昇腾适配引关注
这是目前行业最关心的问题:DeepSeek V4的技术文件披露了大量训练细节,但唯独没有明确训练硬件(显卡)的具体信息。整份文件中,仅提到“华为”(Huawei)1次,提到“英伟达”(Nvidia)3次(不含脚注),提到“GPU”14次(不含脚注),但均未明确GPU型号。唯一的例外是一句“我们在NVIDIA GPU和华为NPU平台上验证了细粒度EP方案”,但这仅代表测试环境,并非训练场景(注:这也是文件中唯一一次提到华为昇腾NPU)。
因此,我们至今仍不清楚V4究竟是在什么硬件上训练完成的。文件中虽几次提到CUDA,但不能仅凭这一点就断定其完全基于英伟达架构。行业内有分析师猜测,V4可能“基于英伟达和华为昇腾混合架构进行训练”,或“在后训练环节对昇腾进行了专门优化”,但DeepSeek官方既未认可,也未否认,始终保持沉默。相比之下,V3的技术文件在开头就明确宣布,其训练采用的是英伟达H800和A100显卡。
有观点根据DeepSeek公告中“预计下半年昇腾950超节点批量上市后,Pro的价格会大幅下调”,得出“V4针对昇腾做了深度优化”“推迟发布是为了适配昇腾”的结论。这种推测虽不能完全排除,但略显跳跃——这句话仅能说明,DeepSeek官方会采购或租用一批昇腾算力,并对昇腾推理进行了常规优化(这在行业内十分常见),至于优化程度有多深、是否为了适配昇腾而推迟发布,目前均无任何实证支持。
不过,要间接证明或证伪这一猜测并不难。由于V4是开源模型,从发布之日起,会有无数厂商用自身算力进行推理测试。若V4确实基于昇腾训练,或对昇腾进行了深度优化,那么其在昇腾硬件上的推理效率,理应高于或至少不低于在英伟达等其他硬件上的效率,甚至可能在昇腾硬件上实现某种独特性能。后续只需关注行业新闻,就能轻松了解实际情况(若未出现相关利好新闻,则可间接证伪)。
值得补充的是,DeepSeek V4已明确与华为昇腾展开合作,华为云MaaS模型即服务平台已为开发者提供免部署、一键调用DeepSeek-V4-Flash API的Tokens服务,昇腾CANN也在V4发布当日,进行了其在昇腾平台的首发直播。据多家媒体报道,V4将运行于华为昇腾950系列芯片,技术架构正从英伟达CUDA生态向华为CANN框架进行底层迁移,这也让市场对其与国产算力的适配充满期待。V4的发布也直接刺激了国产AI芯片板块,发布当日,海光信息上涨6.77%,寒武纪涨超3%,中芯国际港股涨7.96%,华虹半导体港股涨12.20%,科创芯片ETF易方达涨2.87%。据悉,寒武纪已基于vLLM推理框架完成对DeepSeek-V4的Day 0适配,适配代码已开源至GitHub社区。市场观点认为,V4等国产模型积极适配昇腾等国产AI算力芯片,有助于形成国内“模型—芯片—云”的AI商业闭环。
四、产业影响:腾讯成最大期待者,搅动国产大模型格局
除了DeepSeek自身,最期待V4发布并能“震惊世界”的,当属腾讯。就在V4发布的前一天,腾讯混元3.0大模型预览版刚刚亮相,但其光芒瞬间被DeepSeek V4完全掩盖。尽管目前尚未有机会全面试用混元3.0,但结合腾讯此前在基座大模型领域的落后态势来看,仅凭一个版本就实现弯道超车、达到世界先进水平,可能性并不大。
因此,腾讯要做好AI生意——无论是To B领域(尤其是卖Token的MaaS生意),还是To C领域,大概率仍需依赖高质量的第三方开源大模型。目前国内水平最高、使用人数最多的开源大模型是Qwen(通义千问),但它隶属于腾讯的老对手阿里,腾讯显然不愿轻易采用。如此一来,DeepSeek以及几天前刚发布新版本的Kimi,就成为了腾讯最可行的选择。
有分析认为,若DeepSeek未来开放融资,腾讯大概率会不惜代价入局投资。V4的表现越成功,就越能为腾讯争取更多时间:一边全力打造“国产开源生态”集合平台,整合各类开源模型资源;另一边加速追赶自研大模型的实力,缩小与行业头部玩家的差距。
可以说,现在最期待V4在用户测试中传来捷报的,正是腾讯的投资人和管理层。幸运的是,从最初期的反馈来看,V4的表现尚可,海外社区的评价整体偏向积极。但这远远不够,仅“偏向积极”无法支撑其在激烈的市场竞争中站稳脚跟,后续还需要更多正面反馈——我们恐怕还得等待一个星期,才能对V4的整体实力做出更准确的判断。

作者:傲世皇朝




现在致电 5243865 OR 查看更多联系方式 →

傲世皇朝 版权所有