DeepSeek V4 来了

摘要:2026年4月24日,DeepSeek 发布了新一代模型 V4。这次有两个版本:V4-Pro 和 V4-Flash,都已经上线了,而且权重也开源了。你可以去官网 chat.deepseek.com 或者官方 App 直接跟 V4 聊天。

2026年4月24日,DeepSeek 发布了新一代模型 V4。这次有两个版本:V4-Pro 和 V4-Flash,都已经上线了,而且权重也开源了。

你可以去官网 chat.deepseek.com 或者官方 App 直接跟 V4 聊天。API 也同步更新了,开发者可以直接调用。


新模型有什么不一样

一、1M 超长上下文

V4 系列标配了 100 万 token 的上下文记忆。这意味着你可以一次性把整本《三体》三部曲(大概90万字)丢给它,它都能记住。技术上用了新的 token 压缩和 DSA 稀疏注意力,算起来比老方案快不少。

二、两个版本,看你怎么选

V4-Pro 和 V4-Flash 的区别很简单:

  • V4-Pro:总参数 1.6T,激活参数 49B。适合对性能要求高的场景,比如复杂推理、写代码、做分析。

  • V4-Flash:更轻更快更便宜。适合日常使用,响应快,成本低。

三、Agent 能力很强

DeepSeek 说 V4 的 Agent 能力是目前开源里最强的。他们内部已经用上了,用下来体验比 Sonnet 4.5 好,跟 Opus 4.6 的非思考模式差不多。如果你在做 AI Agent 相关的开发,这个值得试试。

四、推理性能领先

在所有公开评测里,V4 的推理表现超过了其他开源模型,跟顶级的闭源模型差不多。代码生成、数学推理这些方面提升明显。


怎么使用?

在线体验

直接打开 chat.deepseek.com 或者下载官方 App,选 V4 模型就能开始聊了。

API 调用

如果你之前用过 DeepSeek 的 API,base_url 不用变,只需要把 model 参数改成下面其中一个:

  • deepseek-v4-pro

  • deepseek-v4-flash

API 支持两种模式:思考模式(带推理过程)和非思考模式(直接出答案)。默认是开启思考模式的,你也可以自己关掉。

下面是一个简单的 Python 调用例子:

from openai import OpenAI

client = OpenAI(
    api_key="你的API密钥",
    base_url="https://api.deepseek.com"
)

messages = [{"role": "user", "content": "解释一下什么是稀疏注意力"}]

response = client.chat.completions.create(
    model="deepseek-v4-pro",
    messages=messages,
    reasoning_effort="high",  # 思考强度,可以选 high 或 max
    extra_body={"thinking": {"type": "enabled"}}  # 开启思考模式
)

# 拿到思维链和最终答案
reasoning = response.choices[0].message.reasoning_content
answer = response.choices[0].message.content

print("思考过程:", reasoning)
print("回答:", answer)

如果你不想看思考过程,把 {"thinking": {"type": "disabled"}} 就行。


需要注意的事情

有一点要提醒你:老模型的名字 deepseek-chat 和 deepseek-reasoner 会在三个月后停用,也就是 2026 年 7 月 24 日。如果你还在用旧名字,记得在这个日期前改成新的。


相关链接

如果你要下载模型权重:

  • 国际用户:去 HuggingFace,链接是 https://huggingface.co/collections/deepseek-ai/deepseek-v4

  • 国内用户:用 ModelScope 镜像,速度更快,链接是 https://modelscope.cn/collections/deepseek-ai/DeepSeek-V4

技术报告也在 HuggingFace 上,想了解细节的可以去读:https://huggingface.co/deepseek-ai/DeepSeek-V4-Pro/blob/main/DeepSeek_V4.pdf

API 详细文档在这里,包括思考模式怎么调、多轮对话怎么拼接、工具调用怎么用:https://api-docs.deepseek.com/zh-cn/guides/thinking_mode


总结

DeepSeek V4 这次升级挺实在的:上下文更长,算得更快,Agent 能力更强,还开源了。无论是普通用户拿来聊天,还是开发者做应用、搞 Agent,都可以试试。三个月内老名字还能用,但最好早点换到新模型。

本文内容仅供个人学习、研究或参考使用,不构成任何形式的决策建议、专业指导或法律依据。未经授权,禁止任何单位或个人以商业售卖、虚假宣传、侵权传播等非学习研究目的使用本文内容。如需分享或转载,请保留原文来源信息,不得篡改、删减内容或侵犯相关权益。感谢您的理解与支持!

链接: https://shenqiku.cn/article/FLY_13706