DeepSeek V4 来了

摘要：2026年4月24日，DeepSeek 发布了新一代模型 V4。这次有两个版本：V4-Pro 和 V4-Flash，都已经上线了，而且权重也开源了。你可以去官网 chat.deepseek.com 或者官方 App 直接跟 V4 聊天。

2026年4月24日，DeepSeek 发布了新一代模型 V4。这次有两个版本：V4-Pro 和 V4-Flash，都已经上线了，而且权重也开源了。

你可以去官网 chat.deepseek.com 或者官方 App 直接跟 V4 聊天。API 也同步更新了，开发者可以直接调用。

新模型有什么不一样

一、1M 超长上下文

V4 系列标配了 100 万 token 的上下文记忆。这意味着你可以一次性把整本《三体》三部曲（大概90万字）丢给它，它都能记住。技术上用了新的 token 压缩和 DSA 稀疏注意力，算起来比老方案快不少。

二、两个版本，看你怎么选

V4-Pro 和 V4-Flash 的区别很简单：

V4-Pro：总参数 1.6T，激活参数 49B。适合对性能要求高的场景，比如复杂推理、写代码、做分析。
V4-Flash：更轻更快更便宜。适合日常使用，响应快，成本低。

三、Agent 能力很强

DeepSeek 说 V4 的 Agent 能力是目前开源里最强的。他们内部已经用上了，用下来体验比 Sonnet 4.5 好，跟 Opus 4.6 的非思考模式差不多。如果你在做 AI Agent 相关的开发，这个值得试试。

四、推理性能领先

在所有公开评测里，V4 的推理表现超过了其他开源模型，跟顶级的闭源模型差不多。代码生成、数学推理这些方面提升明显。

怎么使用？

在线体验

直接打开 chat.deepseek.com 或者下载官方 App，选 V4 模型就能开始聊了。

API 调用

如果你之前用过 DeepSeek 的 API，base_url 不用变，只需要把 model 参数改成下面其中一个：

deepseek-v4-pro
deepseek-v4-flash

API 支持两种模式：思考模式（带推理过程）和非思考模式（直接出答案）。默认是开启思考模式的，你也可以自己关掉。

下面是一个简单的 Python 调用例子：

from openai import OpenAI

client = OpenAI(
    api_key="你的API密钥",
    base_url="https://api.deepseek.com"
)

messages = [{"role": "user", "content": "解释一下什么是稀疏注意力"}]

response = client.chat.completions.create(
    model="deepseek-v4-pro",
    messages=messages,
    reasoning_effort="high",  # 思考强度，可以选 high 或 max
    extra_body={"thinking": {"type": "enabled"}}  # 开启思考模式
)

# 拿到思维链和最终答案
reasoning = response.choices[0].message.reasoning_content
answer = response.choices[0].message.content

print("思考过程：", reasoning)
print("回答：", answer)

如果你不想看思考过程，把 {"thinking": {"type": "disabled"}} 就行。

需要注意的事情

有一点要提醒你：老模型的名字 deepseek-chat 和 deepseek-reasoner 会在三个月后停用，也就是 2026 年 7 月 24 日。如果你还在用旧名字，记得在这个日期前改成新的。

总结

DeepSeek V4 这次升级挺实在的：上下文更长，算得更快，Agent 能力更强，还开源了。无论是普通用户拿来聊天，还是开发者做应用、搞 Agent，都可以试试。三个月内老名字还能用，但最好早点换到新模型。

本文内容仅供个人学习、研究或参考使用，不构成任何形式的决策建议、专业指导或法律依据。未经授权，禁止任何单位或个人以商业售卖、虚假宣传、侵权传播等非学习研究目的使用本文内容。如需分享或转载，请保留原文来源信息，不得篡改、删减内容或侵犯相关权益。感谢您的理解与支持！

链接: https://shenqiku.cn/article/FLY_13706

DeepSeek V4 来了

新模型有什么不一样

怎么使用？

需要注意的事情

相关链接

总结