2026年4月发布的DeepSeek V4 Preview已在开源社区广泛应用。本文基于真实开发任务,对DeepSeek V4 Pro与Flash版本在Agent Coding场景中的表现进行实测对比,重点评估其多文件理解、项目分析与工程落地能力。
Claude Code无缝对接DeepSeek V4
Claude Code以其强大的工具链和执行力著称,但官方模型价格较高且存在封号风险。DeepSeek V4提供了Anthropic兼容接口,这意味着Claude Code可以直接对接DeepSeek,无需任何第三方适配层。
方式一:配置文件法(推荐)
首先确保本机已安装Node.js 18+,运行以下命令安装Claude Code:
npm install -g @anthropic-ai/claude-code
编辑或新增Claude Code配置文件~/.claude/settings.json,添加env字段,填入DeepSeek的后端地址、模型名称和API Key:
{
"env": {
"ANTHROPIC_AUTH_TOKEN": "your_deepseek_api_key",
"ANTHROPIC_BASE_URL": "https://api.deepseek.com/anthropic",
"ANTHROPIC_MODEL": "DeepSeek-V4-Pro",
"API_TIMEOUT_MS": "3000000",
"CLAUDE_CODE_DISABLE_NONESSENTIAL_TRAFFIC": "1"
}
}
将your_deepseek_api_key替换为你在DeepSeek平台申请的API Key。如果使用DeepSeek-V4-Flash,只需将ANTHROPIC_MODEL改为DeepSeek-V4-Flash即可。配置完成后,在命令行输入claude启动Claude Code,首次启动时选择信任当前文件夹。
方式二:CC Switch可视化切换
如果需要在DeepSeek、Claude、MiniMax等多个供应商之间灵活切换,推荐安装CC Switch工具。它专门用于管理Claude Code的模型切换,支持一键切换,还能管理Skills、MCP和提示词。
启动CC Switch后,点击右上角"+"选择自定义供应商,Base URL填写https://api.deepseek.com/anthropic,API Key填写你的DeepSeek API Key,将模型名称改为DeepSeek-V4-Pro或DeepSeek-V4-Flash,点击右下角"添加"完成配置。
验证接入是否成功
在命令行输入claude进入Claude Code界面,然后输入/status命令查看状态。如果显示的Model为DeepSeek-V4-Pro或DeepSeek-V4-Flash,则表示接入成功。
实战一:升级LLM多Provider预设模型列表
第一个任务是更新一个多智能体股票分析项目的模型配置。该项目的Settings页面之前只有纯文本输入框让用户手动填写模型名,不够友好。需要完成两项工作:搜索各家LLM的最新模型版本,然后为前端添加下拉选择功能。
使用提示词:"/tavily-search 搜索当前deepseek、glm和openai最新的模型,然后调整全局配置中默认模型推荐和示例。并且,当前这几个LLM图标太AI味了,帮我换一个上档次点。"
值得注意的是,如果不配置/tavily-search Skill,单纯依靠大模型的训练数据截止日期来猜测最新版本,很容易出错。之前使用其他模型时,需要反复提示多次才能正确获取各家最新模型版本,而DeepSeek V4 Pro一次就完成了任务。
它搜索到了截至2026年4月的最新模型信息,并更新了全局配置中的默认模型推荐和示例。最终修改了三个文件:
application.yml:新增DeepSeek预设Provider,将GLM默认模型升级到glm-5.env.example:补上DeepSeek环境变量,将Kimi默认改为kimi-k2.6SettingsPage.tsx:添加了PROVIDER_PRESETS常量,将Model和Embedding Model改为下拉选择框
最终更新后的四个主要Provider推荐模型列表如下:
- DashScope:
qwen3.6-flash、qwen3.5-plus、qwen3-max、qwq-32b等8款 - DeepSeek:
deepseek-v4-flash、deepseek-v4-pro - GLM:
glm-5.1、glm-5、glm-4.7-flash等8款 - Kimi:
kimi-k2.6、kimi-k2.5、kimi-k2-thinking等5款
实战二:数据库迁移方案诊断与Flyway集成
第二个任务更具挑战性。由于更换了新电脑,所有环境都是重新搭建的。项目中有两个SQL文件,一个在项目启动时自动执行了,另一个却没有。需要让模型诊断问题原因并给出优化方案。
错误日志显示:查询数据库时出现relation "knowledge_skill" does not exist错误,涉及SkillMapper.java中的SQL查询。
使用提示词:"当前项目有两个SQL文件,sql/init.sql在项目启动自动执行了,sql/V2__knowledge_skill.sql没有自动执行。请你帮我分析一下是什么原因,然后用合理的方式优化现存的问题。"
DeepSeek V4 Pro准确分析出问题根源:V2__knowledge_skill.sql没有被挂载到Docker容器中,项目也没有引入任何数据库迁移工具,而init.sql是在容器启动时通过Docker Compose配置写死自动执行的。docker-entrypoint-initdb.d机制本身不支持增量/版本化迁移,只能在数据卷首次创建时执行一次。
它给出的解决方案是集成Flyway作为数据库迁移工具。Flyway是Java生态中最成熟的数据库迁移方案之一,通过文件命名约定(如V1__init.sql、V2__knowledge_skill.sql)自动管理迁移顺序。
整个过程中,DeepSeek V4 Pro完成了以下工作:
- 分析了Docker Compose配置中
init.sql的挂载逻辑 - 发现了
V2__knowledge_skill.sql缺失的原因 - 引入Flyway依赖,编写迁移配置
- 重构SQL文件命名,确保迁移顺序正确
在第一次运行时,Flyway没有成功执行。将错误日志贴给模型后,经过两轮调试成功修复。问题出在Spring Boot 4.x对自动配置模块做了大规模拆分,FlywayAutoConfiguration已从spring-boot-autoconfigure中移除,迁移到了独立模块spring-boot-flyway。如果只引入flyway-core第三方库,Spring Boot不会自动触发任何迁移,且启动日志中不会有任何Flyway相关输出。
正确的依赖引入方式是使用官方Starter:
<dependency>
<groupId>org.springframework.boot</groupId>
<artifactId>spring-boot-starter-flyway</artifactId>
</dependency>
<!-- PostgreSQL 方言支持仍需单独引入 -->
<dependency>
<groupId>org.flywaydb</groupId>
<artifactId>flyway-database-postgresql</artifactId>
</dependency>
最终的优化方案覆盖了三种场景的行为:
- 已有数据库:Flyway检测到无
flyway_schema_history表,自动执行V1-V2,V1所有DDL使用IF NOT EXISTS,对已存在表安全无副作用 - 全新docker-compose up:容器init仅运行扩展和ALTER DATABASE操作,Flyway随后执行V1和V2
- 非docker部署:Flyway执行V1→V2,完全自包含
后续新增迁移只需在db/migration/下按规则命名即可。
实战三:AI面试平台对接DeepSeek
第三个任务是将DeepSeek V4接入已开源的AI智能面试辅助平台+RAG知识库。与实战一类似,对接最新模型的整个过程一遍通过。
通过配置界面将默认模型切换到DeepSeek,选择deepseek-v4-flash。然后上传一份2024届硕士应届生的简历,基于这份简历生成一次模拟面试。面试题和答案均由DeepSeek V4 Flash在快速非思考模式下生成。
最终面试总分为69分,评估结果显示候选人具备扎实的动手实践能力,在Spring Boot、Redis、WebSocket等技术栈的使用上展现了良好的基础认知,但对项目的理解停留在功能实现的表层,缺乏对技术选型背后的权衡、一致性与可靠性保障以及异常场景兜底策略的深度思考。
AI还给出了详细的表现优势和改进建议,并对每个问答记录进行了深度评价,提供了参考答案。从生成质量来看,V4 Flash在非思考模式下的表现已经相当不错,考虑到其定价,性价比非常高。
DeepSeek V4硬参数与定价对比
看完三个实战任务,再来了解一下DeepSeek V4的硬参数和定价,会有更直观的感受。这次V4系列同时发布了两款模型:
| 规格 | DeepSeek-V4-Pro | DeepSeek-V4-Flash |
|---|---|---|
| 总参数 | 1.6T | 284B |
| 每token激活参数 | 49B | 13B |
| 上下文窗口 | 1M tokens | 1M tokens |
| 推理模式 | 非思考 / Think High / Think Max | 非思考 / Think High / Think Max |
| 开源协议 | MIT | MIT |
几个关键数据值得关注:
- V4-Pro的Codeforces评分3206,在Claude Opus 4.6、GPT-5.4 xHigh、Gemini 3.1 Pro High四家主流模型中排名第一
- SWE-bench Verified达到80.6%,与Claude Opus 4.6的80.8%几乎打平,但API价格便宜了两个数量级
- 在1M上下文场景下,V4-Pro的单token推理FLOPs只有V3.2的27%,KV缓存用量只有10%
定价方面,DeepSeek V4相比Claude具有明显优势:
| API定价(每百万token) | DeepSeek-V4-Flash | DeepSeek-V4-Pro | Claude Sonnet 4.7 |
|---|---|---|---|
| 输入(缓存未命中) | $0.14 | $1.74 | $3.00 |
| 输入(缓存命中) | $0.028 | $0.145 | $0.30 |
| 输出 | $0.28 | $3.48 | $15.00 |
Flash的输出价格不到Claude Sonnet的1/50,Pro的输出价格约为Sonnet的1/4,输入端两者差距更小。需要注意的是,deepseek-chat和deepseek-reasoner将在2026年7月24日后停用,建议尽早切换到新模型名。
总结
DeepSeek V4在Agent Coding和代码理解场景上有了明显提升。DeepSeek-V4-Pro在复杂工程任务中表现出色,但在没有Coding Plan的情况下价格仍然偏高。V4-Flash的定价极具竞争力,但在开发场景还无法成为主力,暂不适合作为日常开发的默认选项。
在复杂编码、精准问答和前沿科学推理方面,DeepSeek V4与Claude Opus 4.6以及GPT 5.5还有不小差距。一些复杂任务使用DeepSeek需要多次调教,而换成Claude和GPT则能快速完成。不过考虑到其显著的价格优势,DeepSeek V4仍然是一个非常值得尝试的选择。
如果你需要在多个AI模型之间灵活切换,或者希望降低API调用成本、提高稳定性,推荐使用TreeRouter API中转站。它支持统一接入多家主流大模型,提供负载均衡、故障转移和流量控制等功能,让你的AI应用更加稳定可靠。




