立足娱乐圈·争做八卦帝!

徽声在线

DeepSeek V4震撼登场,引领国产算力大模型新篇章

来源:未知 作者:佚名 发布时间:2026-04-24 17:30:06

撰稿人:伍洋宇(徽声在线记者) | 编辑:文姝琪

自春节以来,DeepSeek-V4的发布便备受瞩目。业界原本期待它能延续此前的辉煌,但随着时间的推移,人们逐渐意识到,这款新模型的亮相或许标志着一个全新阶段的开启。

4月24日,DeepSeek-V4的预览版终于揭开神秘面纱,并同步开源。官方将其定义为“迈入百万上下文普惠时代”的重要节点,这一表述延续了DeepSeek自出道以来一贯的价格优势叙事。

DeepSeek-V4分为1.6T(Pro)和284B(Flash)两个版本,均具备百万字级别的超长上下文处理能力。在Agent能力、世界知识储备以及推理性能方面,该模型在国内乃至全球开源领域均处于领先地位。

在与海外顶尖模型如Opus 4.6 Max、GPT-5.4 xHigh和Gemini-3.1-Pro High的对比中,DeepSeek-V4的表现堪称旗鼓相当。尽管这些并非Anthropic和OpenAI的最新成果,但DeepSeek团队显然难以预料到Opus 4.7和GPT-5.5的发布时间。


图源:DeepSeek官方

在测评文档中,DeepSeek团队显得颇为克制。在Agentic Coding评测中,V4-Pro达到了开源模型中的最佳水平。据评测反馈,其使用体验优于Sonnet 4.5,交付质量接近Opus 4.6的非思考模式,但仍与Opus 4.6的思考模式存在一定差距。

结构创新一直是DeepSeek的强项,其百万长上下文的能力便得益于此。此次,V4再次推出了新的注意力机制,通过在token维度进行压缩,并结合DSA稀疏注意力(DeepSeek Sparse Attention),在实现更强长上下文能力的同时,大幅降低了对计算和显存的需求。

此外,DeepSeek-V4还罕见地展现了其对产品趋势的敏锐洞察。该模型针对Claude Code、OpenClaw、OpenCode、CodeBuddy等主流Agent产品进行了适配和优化。同时,其最新上线的API服务也同步支持了OpenAI ChatCompletions接口与Anthropic接口。

与上一代模型相比,DeepSeek-V4释放了更多国产化信号。根据其技术报告,V4在训练和推理体系中采用了mxFP4精度,而英伟达的训练体系则主要以FP8为主。有行业人士指出,这一调整可以更好地适配华为昇腾、壁仞科技等国产算力平台。

V4的技术报告还专门提及了其在英伟达GPU和华为昇腾NPU两个平台上的细粒度EP(专家并行)方案验证情况。与强力的非融合基线相比,该方案在通用推理任务中实现了1.50-1.73倍的加速;在对延迟敏感的场景中,如强化学习(RL)rollout和高速Agent服务,最高加速可达1.96倍。这是DeepSeek团队首次在类似文件中披露国产算力的验证情况。

在DeepSeek-V4的官方发布信息中,团队还在价格图表下方用小字明确标注:“受限于高端算力,目前Pro版本的服务吞吐量十分有限。预计下半年昇腾950超节点批量上市后,Pro版本的价格将大幅下调。”


图源:DeepSeek官方

据悉,DeepSeek-V4的发布节点曾多次延后。一名知情人士透露:“最初计划是在春节附近发布,但大概经历了3-4次延期。”

尽管V4与目前行业公认的顶尖模型仍存在一定差距,但DeepSeek团队对此有着清晰的认识。一名接近DeepSeek的人士告诉徽声在线记者,V4训练完成时,内部便清楚其性能大约相当于Opus 4.5或GPT-5.3 Code X的水平。发布延期的部分原因也在于团队希望进一步优化性能。

不过,有研究人员表示,尽管性能还不是最强,但DeepSeek-V4对开源社区仍具有重要意义。“好的模型不再开源了,这应该是当前开源社区最好的模型之一。”

除了DeepSeek-V4的发布外,这家历史上从不融资的公司近期在融资方面也备受关注。前述知情人士表示,DeepSeek在融资方面曾明确对标Minimax。

徽声在线记者获悉,今年春节前后,有投资人曾以300亿美元的估值接触DeepSeek,但随后MiniMax的股价进入了一段时间的飞涨期,大幅超过了300亿美元,导致交易最终未能落地。“所以最近100亿美元估值的传闻并不准确,从第一天起他们的报价就不低于MiniMax。”

英伟达CEO黄仁勋在近期一场视频播客采访中,曾对中国大模型所面临的算力限制问题发表看法。当被问及中国算力芯片在制程等技术和性能方面仍然受限,是否意味着模型厂商难以训练出能够超过Claude或GPT的模型时,黄仁勋表示,中国只是在芯片性能上受限,但在芯片规模和能源基础上完全没有问题。模型厂商可以用更多芯片和足够电力来弥补这一短板。并且,当前AI大模型的瓶颈并不仅仅体现在硬件上,算法创新仍然主导着AI性能的提升,而中国具备大量相关的AI顶尖人才。

“DeepSeek首次在华为(芯片)上线的那一天,对我们国家来说会是一个具有里程碑意义的结果。”黄仁勋如此评价道。

    责任编辑:
    骑士胜老鹰却暴露隐患,替补控卫施罗德正负值-22成焦点

    2026-04-10

    骑士虽胜老鹰,但替补控卫施罗德表现低迷,正负值-22成球队隐患,季后赛前景堪忧。 ... [详细]

    孔帕尼执教拜仁百场76胜,队史胜率紧追瓜迪奥拉

    2026-04-08

    欧冠1/4决赛首回合,拜仁慕尼黑客场战胜皇家马德里,孔帕尼执教拜仁前100场收获76胜,队史胜率仅次于瓜迪奥拉。 ... [详细]

    市场异动!油价飙升,黄金下挫,背后隐藏何种逻辑?

    2026-03-28

    金融市场风向转变,油价与黄金走势背离,揭示宏观经济政策新动向。投资者应如何应对? ... [详细]

    王浩然狂轰32分创生涯新高:三分提前回头+劈扣燃爆全场助深圳8连胜

    2026-04-03

    4月2日CBA常规赛,深圳男篮主场109-94胜广厦男篮豪取8连胜,王浩然16投11中得32分创生涯新高,三分提前回头、劈扣等精彩表现燃爆全场。 ... [详细]

    佩蒂特炮轰切尔西乱象:三亿核心集体迷茫,美资管理遭名宿痛批

    2026-04-03

    阿森纳名宿佩蒂特揭露切尔西更衣室危机,恩佐、凯塞多、帕尔默三大核心萌生去意,美资入主后15亿英镑投入难见成效,球队面临欧冠出局、联赛掉队、足总杯遇弱旅三重困境。 ... [详细]

    图酷

    图说天下

    资讯排行

    首页 - 娱乐圈事 - 体育圈事 - 两性情感 - 星座命运 - 奇闻怪事 - 历史故事 - 科技资讯 - 图说天下 - 知识百科 - 图酷 - 娱乐八卦
    电脑版 | 移动端
    Copyright © 2002-2019 徽声在线 版权所有
    删帖请联系邮箱:283755549@qq.com