DeepSeek V4适配华为升腾芯片黄仁勋预言的“灾难”降临

DeepSeek V4刚上线，海外媒体有人看到性能，有人看到价格，也有人看到华为。彭博把它写成对OpenAI和Anthropic的有力挑战，《财富》盯上的是它再次把价格打到地板附近；路透社的切口更敏感：这不只是一个更便宜、更擅长长文本的新模型，并且DeepSeek首次明确披露，V4系列已适配华为升腾芯片。当然路透社也没忘补一刀，称V4仍落后于部分顶级闭源模型，而且暂时不支持多模态。

但就是"华为"这两个字，把整个讨论带到了另一层。V4引发的不只是"模型强不强"的讨论，还有"它会把谁逼急"。英伟达CEO黄仁勋本月在播客里放过一句狠话："如果DeepSeek先在华为平台上发布，那对美国来说将是灾难性的。"现在回头看，这句话几乎像是在给V4的舆论场提前打底。

所以DeepSeek V4这次最有意思的，不是又多了几个跑分，而是它一上线，就让美国媒体同时露出了两种情绪。一边承认中国公司正在用更低的价格和更高的工程效率继续逼近，另一边又不太愿意承认，硅谷靠芯片、资本和封闭生态筑起的那道墙，已经开始松动了。

一、极致性价比：打破硅谷的竞争护城河

4月24日，DeepSeek V4预览版正式发布并同步开源，推出两条产品线：旗舰版V4-Pro和轻量版V4-Flash。两款模型均原生支持100万token上下文。V4-Pro重点强化Agent能力，在Agentic Coding、数学、STEM、竞赛编程及世界知识等多项评测中达到开源模型领先水平，部分能力已接近顶级闭源模型。V4-Flash更注重低成本与高性价比，适合日常高频调用。价格方面，V4-Pro输入（缓存命中）1元每百万token、输出24元每百万token；V4-Flash输入（缓存命中）仅0.2元每百万token、输出2元每百万token。

与前代相比，V4最大的突破不是单纯堆参数，而是通过CSA（压缩稀疏注意力）、HCA（重度压缩注意力）等混合注意力机制创新，大幅降低了长上下文的计算与内存成本，把“100万上下文”从展示参数变成了真正能用的标配。整体来看，V4延续了“便宜又强”的产品风格，是一次面向长程Agent和大规模长上下文应用的基础设施级升级。

对此，《彭博社》认为DeepSeek V4称得上目前最强大的开源平台，是对OpenAI和Anthropic的有力挑战。新模型的发布让全球科技公司和投资者开始重新审视在人工智能上投入数十亿美元的明智性。

CNBC将V4的发布形容为一次“实力的全方位展示”。报道指出，尽管V4的市场冲击力可能不如R1那样具有颠覆性，因为市场已预期到中国AI的低价竞争，但它直接将美国竞争对手置于极大的压力之下。

《财富》则重点关注V4的“地板价”。文章强调V4-Pro的价格仅为OpenAI或Anthropic类似服务的六分之一到十分之一，这种极端的性价比优势可能彻底打破美国领先实验室的竞争护城河。

之所以能把价格打到地板上，并非仅仅因为商业策略的激进，核心秘密藏在DeepSeek对模型底层架构的颠覆性重构里。

二、“技术优雅”：用算法效率对抗暴力算力

VentureBeat惊叹于V4的“智能密度”，称其为“重返战场的巨鲸”。文章详细解析了其引入的混合注意力机制和流形约束超连接（mHC），认为这些创新在不牺牲性能的前提下，极大地降低了显存需求和计算成本。

不过VentureBeat也客观指出，V4目前仍存在局限性，例如不支持图像和视频那么多模态能力。

半岛电视台提到V4-Pro在数学和代码能力上已击败所有开源模型，目前仅在“世界知识”等少数领域落后于谷歌的闭源模型Gemini 3.1 Pro。开源平台Hugging Face官方则欢迎这条“巨鲸”的回归，认为“高性价比的百万级长文本时代”已经正式到来。

路透社援引Hugging Face机器学习工程师路易斯·坦斯托尔（Lewis Tunstall）的话确认，V4是该平台上冲上榜首速度最快的模型，在处理长且复杂的文本任务时表现卓越且廉价。

然而，极致的效率也伴随着显而易见的“偏科”。

坦斯托尔等专家指出，V4目前依然是一个纯文本模型，在图像理解和视频生成等主流赛道上完全缺席，这在多模态已成标配的今天，限制了它在创意产业的想象空间。此外，DeepSeek官方也坦言，V4在“世界知识”储备上仍落后于Gemini 3.1 Pro，这意味着在处理极具时效性的全球动态或复杂文化背景时，V4依然难以完全摆脱“幻觉”的困扰。

三、“主权AI”：大国博弈下的硬件突围

那么“四两拨千斤”的DeepSeek，究竟是用什么芯片练出了V4？

路透社和《纽约时报》都提到过，DeepSeek在早期研发中曾使用英伟达芯片，如H800或传闻中的合规版H20，但到了V4周期，情况发生了剧变。DeepSeek明确表示，V4在研发过程中进行了英伟达GPU与华为升腾（Ascend）NPU的并行验证。综合社交媒体与行业分析，V4极大地受益于与华为最新算力集群如Ascend SuperPoD的深度协同，尤其是在FP4低精度推理等前沿技术上的原生支持，让V4在国产芯片上的能效比大幅提升。

这意味着AI模型已经开始围绕中国本土硬件进行原生优化。路透社敏锐地察觉到DeepSeek转向华为芯片的战略意义，认为这是中国推动自主创新的代表之作。这也正好印证了黄仁勋的担忧。他最近在播客中坦承：“我们必须承认AI的大部分进步都来自算法而非原始硬件，DeepSeek绝非无关紧要的进步。如果DeepSeek先在华为平台上发布，那对我们国家来说将是灾难性的。”

《纽约时报》认为V4进一步扩展了中国在开源AI领域的影响力，并称“开源是未来技术的软实力”。文中提到，DeepSeek的技术正从吉隆坡到拉各斯被全球开发者采用，帮助中国技术绕过美国的硬件封锁。

亚洲新闻台则认为V4的到来是硬件与成本的“拐点”。通过与华为升腾芯片的深度协作，中国正在实现从算法到硬件的“自给自足”，这对中国AI产业的独立性具有里程碑意义。

四、全球开发者的“实战体感”：有真香，也不乏质疑

宏观层面的博弈固然波谲云诡，但对于每天写代码、调API的开发者来说，好不好用、稳不稳定，才是唯一的评判标准。在Reddit和X等社交平台上，全球开发者的“实战体感”已经把这场讨论推向了沸点。

V4发布后，Reddit和X瞬间成了技术拆解和行业博弈的前沿阵地。

在Reddit上，开发者聚焦长文本的稳定性。

资深用户a9udn9u直言V4处理长文本的能力“简直疯了”（absolutely insane），在理解超大型代码库时提供了巨大帮助。

用户Comfortable-Rock-498也深有同感。他特意把测试推向超长上下文，发现V4-Flash竟然做到了“零失误”。

SignalCompetitive582指出，V4带来的最大改变是让LLM的运行从“受限于显存”转变为“受限于算力”。这意味着未来AI编程工具可以提供更慷慨的订阅限额，“普惠价格”让大规模商业自动化在经济上变得完全可行。

InterstellarReddit形容DeepSeek像是“闻到了水中的血腥味就立即出击了”（smelled blood in the water and struck immediately），认为其极致的性价比将再次重创美国AI市场。

也有冷静的声音。CallMePyro等用户客观指出V4-Pro在综合素质上与Claude 4.7仍有差距，但建议大家至少试试V4-Flash，和谷歌Gemini 3 Flash比一比。

在X平台上，讨论上升到架构创新、科技权力乃至愿景的高度。

技术专家MZ（@myknz）发长文指出，美国实验室如OpenAI和Anthropic目前更偏向通过“暴力堆砌算力”（Brute-forcing）来提升模型性能，而DeepSeek则代表了通过“架构效率”（Architectural efficiency）实现突破的路线。他犀利地指出，美国实验室正“悄悄地吸收”中国公司如DeepSeek、阿里巴巴和月之暗面贡献的工程方案，但在公开场合却散布“中国偷窃”的叙事来保护自己的封闭模型。

MZ进一步分析称，全球AI生态正处于一种虚伪的“纳什均衡”，即美国控制着叙事和高利润率，并利用开源研发成果；而中国公司则通过持续开源来确保全球开发者采用中国标准，从而绕过美国的硬件封锁。

知名博主Lisan al Gaib认为V4目前处于GPT-5.2或Opus 4.5+的级别，虽然落后于顶尖闭源模型约4到5个月，但领先于其他中国AI模型，位列其次的是Kimi K2.6。在1.6万亿参数规模下，V4的重量级已经与GPT-5.4相当。他还提到，相关技术论文详细介绍了模型的训练和技术架构，推测其他开源实验室会采用这种在长上下文中表现优异的架构。

当然，冷静的审视同样不少。

AI工程师Daniel Dewhurst提醒大家要谨慎对待官方给出的Benchmark，认为在缺乏独立评估前，这些华丽的数据可能存在针对测试集的优化。Lisan al Gaib更是直言V4看起来依然“欠火候”（undercooked），在推理逻辑上相比V3.2并没有本质的飞跃。

也有用户提到DeepSeek V4在法律任务上目前表现很差。

Sage Aurélius则提醒人们不要被“纯粹开源”的热情冲昏头脑。他认为DeepSeek采用MIT协议是聪明的商业策略，即通过释放强力模型抢占开发者心智和数据，再通过托管服务赚取高额利润，这是经典的“核心开源”（Open-core）模式。

而DeepSeek研究员陈德利在X上将V4称为“心血之作”，并重申了公司的愿景：“AGI属于每一个人。”

五、结语：真正创新不惧围墙

DeepSeek V4的登场，直指硅谷构建了十几年的“算力霸权”逻辑。

它告诉世界，在通往未来的道路上，暴力堆算力并非唯一的答案，架构效率同样能跑出惊人的成绩。当全球开发者都在为V4的稳定与廉价欢呼时，我们看到的不只是一个中国AI品牌的崛起，更是一场全球科技权力格局的悄然洗牌。

“深海巨鲸”已经浮出水面。如果AGI的未来注定属于每一个人，那么这场打破封锁、击穿价格、重塑效率的博弈，才刚刚进入下半场。