DeepSeek 发布DeepSeek R1-0528更新,昨晚向微信技术群体通报此次更新为“小规模试验性升级”,并已开放测试。
DeepSeek R1-0528 更新亮点
1️⃣ 🧑💻 代码能力显著提升
- 可快速生成高质量代码。
- 能处理复杂编程挑战,如重构 1,500 行 Python 代码。
- 更擅长解决多步骤逻辑问题和边缘用例。
2️⃣ 🧠 推理能力更深层次
- 类似 Google 最新模型,具备复杂、缜密的思考流程。
- 不仅是表层应答,更能进行结构化逻辑推理与分析。
- 适用于高级数学、逻辑游戏、辩证性问题。
3️⃣ ✍️ 写作能力大幅增强
- 语言更自然、流畅,逻辑结构更清晰。
- 擅长长文写作与内容创作,支持多段落、段间衔接合理。
- 对比前代模型,生成文本更具人类风格。
4️⃣ 🔄 推理风格更具个性
- 思考方式更有条理性与连贯性。
- 呈现出“有个性”的解题风格,非模板化回答。
- 对复杂问题的解法更具系统性。
5️⃣ ⏱ 支持长时间思维连续性
- 在30–60 分钟内保持推理上下文连贯性。
- 适合处理多步骤复杂任务,如长对话、长文案撰写、连续编程问题。
6️⃣ 🛠 问题修复与优化
修复早期 R1 模型的常见问题:
- 重复回答问题
- 格式混乱
- 语言混用(中英夹杂)
- 输出更规范,适合专业场景使用。
📊 技术表现
Benchmark 评测:在由 UC Berkeley、MIT 和 Cornell 开发的 LiveCodeBench 代码生成评测中:
- R1-0528 的推理能力与 OpenAI 的 o3等前沿模型性能相当,略低于o4 mini,尤其在数学、编程和复杂推理任务上表现出色。
- 优于 xAI 的 Grok 3 mini 和阿里巴巴的 Qwen 3。
- 推理行为更深思熟虑,链式推理(Chain-of-Thought, CoT)结构更清晰,输出格式更自然。
该成绩进一步增强了 DeepSeek 在中美 AI 技术竞争中的影响力。
DeepSeek已将 R1-0528 上传至 Hugging Face,但尚未发布公开说明或模型描述。
最新调用Deepseek-R1-0528 API 的网站
1、Openrouter 地址:https://openrouter.ai
GMI tutt: https://inference-engine.gmicloud.ai
Novita tutt: https://novita.ai
Nebius tbtit: https://studio.nebius.com
Inference toti: https://inference.net
模型:https://huggingface.co/deepseek-ai/DeepSeek-R1-0528/tree/main