DeepSeek V4终于来了，我们知道些什么？

日期：2026-04-28 16:03:35 / 人气：112

万众期待的DeepSeek V4预览版终于在北京时间4月24日上午发布了。此前，媒体和分析师曾反复预测V4即将发布，并已经多次预测失败，这一次终于成功了。由于模型发布时间还太短，第三方和客户评测还在紧锣密鼓的进行中，现在的有效信息其实很少。不过，通过技术文档、海外AI社区的初步讨论以及最新的行业动态，我们还是能得到一些关键情报。
一、核心战略：聚焦Agent能力，贴合“全民养龙虾”潮流
V4的核心战略方向是大幅提升Agent能力，这与OpenClaw发布以来的全球AI发展潮流高度契合。自“全民养龙虾”的浪潮兴起后，MiniMax、Kimi和智谱等国产大模型厂商获得了巨大的Token增量，但其中最核心、最专业的增量却被Claude牢牢占据。
Agent能力与编程能力密不可分，目前Claude Code仍是全球最强大的AI编程工具（没有之一），即便GPT-Codex也无法撼动其地位。DeepSeek官方在公告开头最显眼的位置明确宣称“Agent能力大幅提高”，但也坦诚“（据评测反馈）仍与Opus 4.6思考模式存在一定差距”。
海外AI社区中，有部分用户兴奋地期待DeepSeek V4能成为“Claude杀手”——公允而言，这更多是一种美好愿望，背后藏着“天下苦Anthropic久矣”的行业情绪，许多人对Claude及其开发商Anthropic的垄断地位颇有微词。从目前的测试数据来看，V4的Token性价比优势突出，但Agent Benchmark指标并未超过Claude Opus-4.6和GPT-5.4。
需要注意的是，Benchmark分数仅具有参考意义，实际用户体验才是关键。Claude在许多Benchmark测试中并不优于GPT和Gemini，但这并不妨碍它在Agent领域几乎一枝独秀。因此，接下来一段时间，专业用户使用DeepSeek V4进行Agent操作的实际反馈，将成为判断其竞争力的核心依据。
此外，V4将上下文窗口扩展至1M，这是一项重要提升，结合其较低的Token定价，有望大幅提升生产力。不过，这一优势的实际效果，仍需等待专业客户执行复杂任务后的反馈，预计还需等待两三天才能有初步结论。
结合行业趋势推测，DeepSeek V4从传说中的“1月/2月发布”推迟至4月，大概率是为了打磨Agent能力——“龙虾”这波增量超出了所有人的预期，与其发布一个跟不上现实Agentic Workflow需求的模型，不如多花几个月时间，推出一个完全贴合市场需求的版本。当然，这只是个人猜测，目前尚无实证支撑。
二、用户反馈：非核心场景表现偏“干”，或为降低幻觉率的取舍
从最初一波海外客户的使用反馈来看，V4在执行“非深度推理、非数学、非代码”类任务（如头脑风暴、文艺创作）时，给人的感受偏“干”（dry）、“过于正式”，不仅落后于Claude和GPT的最新版本，甚至有用户认为其表现不及GPT-5.2。
需要强调的是，这些均为零碎的主观感受，不能代表V4的整体实力，且文艺创作本身并非V4的主要发力方向。但即便如此，这种反馈仍有可能对消费端用户的选择倾向造成微妙影响，进而扰动当前互联网大厂在C端AI应用市场的竞争格局。
对此，有一个合理的猜测：V4的“干”与“正式”，或许是为了解决V3/R1版本幻觉率较高的问题。从行业规律来看，AI模型的自由发挥往往会伴随幻觉率上升，而要限制幻觉率，大概率会导致回答变得“更干、更严谨”。这一猜测是否成立，仍需等待更广泛、更全面的测试结果来验证。
三、核心悬念：训练硬件成谜，昇腾适配引关注
这是目前行业最关心的问题：DeepSeek V4的技术文件披露了大量训练细节，但唯独没有明确训练硬件（显卡）的具体信息。整份文件中，仅提到“华为”（Huawei）1次，提到“英伟达”（Nvidia）3次（不含脚注），提到“GPU”14次（不含脚注），但均未明确GPU型号。唯一的例外是一句“我们在NVIDIA GPU和华为NPU平台上验证了细粒度EP方案”，但这仅代表测试环境，并非训练场景（注：这也是文件中唯一一次提到华为昇腾NPU）。
因此，我们至今仍不清楚V4究竟是在什么硬件上训练完成的。文件中虽几次提到CUDA，但不能仅凭这一点就断定其完全基于英伟达架构。行业内有分析师猜测，V4可能“基于英伟达和华为昇腾混合架构进行训练”，或“在后训练环节对昇腾进行了专门优化”，但DeepSeek官方既未认可，也未否认，始终保持沉默。相比之下，V3的技术文件在开头就明确宣布，其训练采用的是英伟达H800和A100显卡。
有观点根据DeepSeek公告中“预计下半年昇腾950超节点批量上市后，Pro的价格会大幅下调”，得出“V4针对昇腾做了深度优化”“推迟发布是为了适配昇腾”的结论。这种推测虽不能完全排除，但略显跳跃——这句话仅能说明，DeepSeek官方会采购或租用一批昇腾算力，并对昇腾推理进行了常规优化（这在行业内十分常见），至于优化程度有多深、是否为了适配昇腾而推迟发布，目前均无任何实证支持。
不过，要间接证明或证伪这一猜测并不难。由于V4是开源模型，从发布之日起，会有无数厂商用自身算力进行推理测试。若V4确实基于昇腾训练，或对昇腾进行了深度优化，那么其在昇腾硬件上的推理效率，理应高于或至少不低于在英伟达等其他硬件上的效率，甚至可能在昇腾硬件上实现某种独特性能。后续只需关注行业新闻，就能轻松了解实际情况（若未出现相关利好新闻，则可间接证伪）。
值得补充的是，DeepSeek V4已明确与华为昇腾展开合作，华为云MaaS模型即服务平台已为开发者提供免部署、一键调用DeepSeek-V4-Flash API的Tokens服务，昇腾CANN也在V4发布当日，进行了其在昇腾平台的首发直播。据多家媒体报道，V4将运行于华为昇腾950系列芯片，技术架构正从英伟达CUDA生态向华为CANN框架进行底层迁移，这也让市场对其与国产算力的适配充满期待。V4的发布也直接刺激了国产AI芯片板块，发布当日，海光信息上涨6.77%，寒武纪涨超3%，中芯国际港股涨7.96%，华虹半导体港股涨12.20%，科创芯片ETF易方达涨2.87%。据悉，寒武纪已基于vLLM推理框架完成对DeepSeek-V4的Day 0适配，适配代码已开源至GitHub社区。市场观点认为，V4等国产模型积极适配昇腾等国产AI算力芯片，有助于形成国内“模型—芯片—云”的AI商业闭环。
四、产业影响：腾讯成最大期待者，搅动国产大模型格局
除了DeepSeek自身，最期待V4发布并能“震惊世界”的，当属腾讯。就在V4发布的前一天，腾讯混元3.0大模型预览版刚刚亮相，但其光芒瞬间被DeepSeek V4完全掩盖。尽管目前尚未有机会全面试用混元3.0，但结合腾讯此前在基座大模型领域的落后态势来看，仅凭一个版本就实现弯道超车、达到世界先进水平，可能性并不大。
因此，腾讯要做好AI生意——无论是To B领域（尤其是卖Token的MaaS生意），还是To C领域，大概率仍需依赖高质量的第三方开源大模型。目前国内水平最高、使用人数最多的开源大模型是Qwen（通义千问），但它隶属于腾讯的老对手阿里，腾讯显然不愿轻易采用。如此一来，DeepSeek以及几天前刚发布新版本的Kimi，就成为了腾讯最可行的选择。
有分析认为，若DeepSeek未来开放融资，腾讯大概率会不惜代价入局投资。V4的表现越成功，就越能为腾讯争取更多时间：一边全力打造“国产开源生态”集合平台，整合各类开源模型资源；另一边加速追赶自研大模型的实力，缩小与行业头部玩家的差距。
可以说，现在最期待V4在用户测试中传来捷报的，正是腾讯的投资人和管理层。幸运的是，从最初期的反馈来看，V4的表现尚可，海外社区的评价整体偏向积极。但这远远不够，仅“偏向积极”无法支撑其在激烈的市场竞争中站稳脚跟，后续还需要更多正面反馈——我们恐怕还得等待一个星期，才能对V4的整体实力做出更准确的判断。

作者：傲世皇朝

DeepSeek V4终于来了，我们知道些什么？

新闻资讯 News

案例展示 Case

现在致电 5243865 OR 查看更多联系方式 →

现在致电 5243865 OR 查看更多联系方式 →