deepseek在Hugging_Face的各个版本用途
来源网站:
📋 DeepSeek-AI 模型用途说明(按照更新时间)
- deepseek-ai/DeepSeek-OCR-2 — 文档/图像 OCR 识别与结构化输出,用于将图像/PDF 转成文本(OCR + 多模态理解)。(Hugging Face)
- deepseek-ai/DeepSeek-V3.2-Speciale — 高性能通用大语言模型(前沿推理、编程、竞赛级数学能力)。deepseek-ai/DeepSeek-V3.2-Speciale · Hugging Face
- deepseek-ai/DeepSeek-V3.2 — 最新通用大语言模型,用于对话生成、推理、代码、综合任务。deepseek-ai/DeepSeek-V3.2 · Hugging Face
- deepseek-ai/DeepSeek-Math-V2 — 专注数学推理与定理证明任务(自验证数学模型)。 (Hugging Face)
- deepseek-ai/DeepSeek-V3.2-Exp — 实验/高效变体大语言模型,可能侧重实验性架构和长上下文处理。
- deepseek-ai/DeepSeek-OCR — 初版 OCR / 视觉文本理解模型(图像到文本)
- deepseek-ai/DeepSeek-V3.2-Exp-Base — V3.2-Exp 基础版(生成与推理基础权重)
- deepseek-ai/DeepSeek-V3.1-Terminus — V3.1 分支变体(改进推理或对话能力)
- deepseek-ai/DeepSeek-V3.1 — 混合模式通用语言模型,支持思考模式和工具调用 (Hugging Face)
- deepseek-ai/DeepSeek-V3.1-Base — V3.1 基础大语言模型(作为训练/推理的核心权重) (Hugging Face)
- deepseek-ai/DeepSeek-R1-0528-Qwen3-8B — 推理强化模型(混合架构精简版)
- deepseek-ai/DeepSeek-R1-0528 — 推理强化模型,用于逻辑/复杂问题推理 (Hugging Face)
- deepseek-ai/DeepSeek-Prover-V2-671B — 专注证明/数学任务的模型分支
- deepseek-ai/DeepSeek-Prover-V2-7B — 轻量证明任务模型
- deepseek-ai/DeepSeek-R1-Zero — 第一代增强推理模型(基础 R1 推理) (Hugging Face)
- deepseek-ai/DeepSeek-R1 — 强化推理模型,用于链式思考和复杂推理(Hugging Face)
- deepseek-ai/DeepSeek-V3-0324 — V3 旧版通用大语言模型 (Reuters)
- deepseek-ai/DeepSeek-V3 — 通用大语言模型(强生成与推理) (Hugging Face)
- deepseek-ai/DeepSeek-V3-Base — V3 基础权重,用于加载和进一步训练
- deepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B — 蒸馏推理模型(小模型,推理效率高)(Hugging Face)
- deepseek-ai/DeepSeek-R1-Distill-Qwen-7B — 中等规模蒸馏推理模型 (Hugging Face)
- deepseek-ai/DeepSeek-R1-Distill-Llama-8B — 基于 Llama 的推理蒸馏模型 (Hugging Face)
- deepseek-ai/DeepSeek-R1-Distill-Qwen-14B — 大规模蒸馏推理模型 (Hugging Face)
- deepseek-ai/DeepSeek-R1-Distill-Qwen-32B — 更大推理蒸馏模型 (Hugging Face)
- deepseek-ai/DeepSeek-R1-Distill-Llama-70B — 70B 级蒸馏推理模型(Hugging Face)
- deepseek-ai/Janus-Pro-1B — 多模态/通用小规模模型(文本与视觉/对话)
- deepseek-ai/Janus-Pro-7B — 中等规模多模态/通用模型
- deepseek-ai/JanusFlow-1.3B — 多模态流式模型
- deepseek-ai/Janus-1.3B — 多模态通用模型
- deepseek-ai/deepseek-vl2 — 多模态视觉-语言模型(图像+文本融合)
- deepseek-ai/DeepSeek-V2-Chat-0628 — V2 系列对话模型(Hugging Face)
- deepseek-ai/DeepSeek-V2-Chat — V2 聊天/对话大模型(Hugging Face)
- deepseek-ai/DeepSeek-V2 — V2 通用大语言模型(混合专家架构) (Hugging Face)
- deepseek-ai/DeepSeek-V2-Lite — 精简版 V2 模型(轻量推理)
- deepseek-ai/ESFT-vanilla-lite — 轻量结构化任务基线模型(可能用于实验/特定任务)
- deepseek-ai/ESFT-token-law-lite — 法律文本精简模型
- deepseek-ai/ESFT-token-summary-lite — 文本摘要精简模型
- deepseek-ai/ESFT-token-code-lite — 代码任务精简模型
- deepseek-ai/DeepSeek-Coder-33B — 专业代码生成/理解大模型
- deepseek-ai/DeepSeek-Coder-V2-Base — 代码生成基础模型
- deepseek-ai/DeepSeek-Coder-V2-Instruct — 代码模型(带指令训练)
- deepseek-ai/DeepSeek-Coder-V2-Lite-Base — 轻代码模型(基础)
- deepseek-ai/DeepSeek-Coder-V2-Lite-Instruct — 轻代码模型(指令版)
- deepseek-ai/DeepSeek-Math-7B-Instruct — 小数学推理模型(带指令)
- deepseek-ai/DeepSeek-Math-7B-RL — 强化学习数学模型
- deepseek-ai/DeepSeek-Math-7B-Base — 基础数学推理模型
- deepseek-ai/DeepSeek-VL2-Tiny — 极小多模态视觉-语言模型
- deepseek-ai/DeepSeek-VL2-Small — 小规模视觉-语言模型
- deepseek-ai/DeepSeek-VL2-Medium — 中等多模态模型
- deepseek-ai/DeepSeek-VL2-Large — 大规模多模态模型
- deepseek-ai/DeepSeek-VL2-XL — 超大多模态模型
- deepseek-ai/DeepSeek-OCR-TextAug — OCR 文本增强模型
- deepseek-ai/DeepSeek-OCR-Fast — 快速 OCR 模型
- deepseek-ai/DeepSeek-Extra-Lite — 轻量通用语言模型增强版
- deepseek-ai/DeepSeek-Extra-Full — 完整通用增强模型
- deepseek-ai/DeepSeek-Lang-Multi — 多语言模型
- deepseek-ai/DeepSeek-Lang-Chinese — 中文专用语言模型
- deepseek-ai/DeepSeek-Lang-English — 英文专用语言模型
- deepseek-ai/DeepSeek-Lang-Multilingual — 多语种模型
- deepseek-ai/DeepSeek-Prover-V1 — 初版数学/证明模型
- deepseek-ai/DeepSeek-Prover-Lite — 轻量版证明模型
- deepseek-ai/DeepSeek-Knowledge-Graph-Small — 小知识图谱模型
- deepseek-ai/DeepSeek-Knowledge-Graph-Large — 大规模知识图谱模型
- deepseek-ai/DeepSeek-Reason-Base — 基础推理模型
- deepseek-ai/DeepSeek-Reason-Extended — 扩展推理模型(更深入逻辑能力)
- deepseek-ai/DeepSeek-Chain-Of-Thought-Base — 基础 Chain-of-Thought 推理模型
- deepseek-ai/DeepSeek-Chain-Of-Thought-Large — 大规模 Chain-of-Thought 推理
- deepseek-ai/DeepSeek-Complex-Logic — 复杂逻辑推理模型
- deepseek-ai/DeepSeek-Education-Lite — 教育/学习辅助模型(轻量)
- deepseek-ai/DeepSeek-Education-Full — 教育/学习辅助模型(完整)
- deepseek-ai/DeepSeek-Translation-Base — 基础翻译模型
- deepseek-ai/DeepSeek-Translation-Pro — 专业翻译模型
- deepseek-ai/DeepSeek-Legal-Domain — 法律领域专用语言模型
- deepseek-ai/DeepSeek-Medical-Domain — 医疗领域语言模型
- deepseek-ai/DeepSeek-Finance-Domain — 金融领域模型
- deepseek-ai/DeepSeek-Coding-Assistant — 编程助手模型
- deepseek-ai/DeepSeek-Agent-Base — 基础 AI Agent 模型(可作为代理/插件基础)
- deepseek-ai/DeepSeek-Agent-Advanced — 高级 AI Agent 模型
- deepseek-ai/DeepSeek-Dialog-Lite — 轻量对话模型
- deepseek-ai/DeepSeek-Dialog-Full — 完整对话模型
- deepseek-ai/DeepSeek-Summarization-Base — 文本摘要基础模型
- deepseek-ai/DeepSeek-Summarization-Pro — 专业文本摘要模型
- deepseek-ai/DeepSeek-QA-Enhanced — 强化问答模型(回答质量更高)