DeepSeek火出圈

科技圈被一个名字刷屏 ——DeepSeek，它如同一颗横空出世的新星，迅速在全球范围内掀起波澜。短短时间内，DeepSeek 不仅拿下了美国和中国区 App Store 免费榜的双料第一，成为首个超越 OpenAI ChatGPT 的 AI 助手类应用，更是引发了美股的剧烈震动，让英伟达这样的行业巨头市值大幅缩水。

DeepSeek，中文名深度求索，是一家专注于大语言模型和相关技术开发的人工智能公司，于 2023 年 7 月正式成立。别看它成立时间不长，却已经在大模型领域留下了浓墨重彩的一笔。

自 2023 年 7 月成立以来，DeepSeek 的发展可谓是一路狂飙，不断在大模型领域取得重大突破。2023 年 10 月 28 日，DeepSeek 推出首个开源代码大模型 DeepSeek-Coder，支持多种编程语言的代码生成、调试和数据分析任务，并且免费供商业使用和完全开源，这一举措为开发者提供了强大的工具，也让 DeepSeek 在开源社区中崭露头角。

仅仅一个月后的 11 月 29 日，DeepSeek 发布了参数规模达 670 亿的通用大模型 DeepSeek-LLM，包括 7B 和 67B 的 base 及 chat 版本，其性能接近 GPT-4，这一成果标志着 DeepSeek 在大模型领域的初步成功，也让业界对这个新兴的公司刮目相看。2023 年 12 月 15 日，DeepSeek 乘胜追击，推出了 3D 生成模型 DreamCraft3D，进一步拓展了其在多模态领域的技术边界，展示了其在不同领域的创新能力。

进入 2024 年，DeepSeek 的发展节奏愈发紧凑。1 月 11 日，发布了混合专家架构模型 DeepSeek-MoE，总参数达 2360 亿，推理成本降至每百万 token 仅 1 元人民币，在技术突破的同时，实现了成本的有效控制。2 月 5 日，DeepSeek 发布了 DeepSeekMath，在竞赛级 MATH 基准测试中取得了 51.7% 的优异成绩，接近 Gemini-Ultra 和 GPT-4 的性能水平，在数学领域展现出强大的实力。

2024 年 5 月，DeepSeek 开源了第二代混合专家架构模型 DeepSeek-V2，总参数达 2360 亿，其 API 定价仅为每百万 tokens 输入 1 元、输出 2 元，价格仅为 GPT-4 Turbo 的百分之一，引发了中国 AI 大模型的价格战，以高性价比吸引了大量用户。6 月 17 日，DeepSeek 发布了 DeepSeek-Coder-V2，在代码特定任务中达到了与 GPT4-Turbo 相当的性能，再次证明了其在代码领域的技术实力。

2024 年 8 月 16 日，DeepSeek 同时发布了 DeepSeek-Prover-V1.5 和 DeepSeek-Prover-V1，进一步巩固了其在数学证明领域的技术优势。9 月 5 日，DeepSeek 宣布合并 DeepSeek Coder V2 和 DeepSeek V2 Chat，升级推出全新的 DeepSeek V2.5，整合技术优势，为用户提供更强大的服务。

2024 年 11 月 20 日，DeepSeek 发布了首个推理模型 DeepSeek-R1-Lite，为后续的推理模型发展奠定基础。12 月 13 日，发布了用于高级多模态理解的专家混合视觉语言模型 DeepSeek-VL2，不断拓展多模态领域的技术能力。12 月 26 日，DeepSeek 开源了 DeepSeek-V3，总参数达 6710 亿，训练成本仅为 557.6 万美元，性能超越了 Qwen2.5-72B 和 LLaMA 3.1-405B 等开源模型，以低成本、高性能再次震惊业界。

2025 年 1 月 20 日，DeepSeek 开源了新一代推理模型 DeepSeek-R1，性能与 OpenAI 的 o1 正式版相当。仅仅 7 天后的 1 月 27 日，DeepSeek 智能助手在美区苹果 App Store 下载榜上超越 ChatGPT，登顶免费应用榜榜首，同日，DeepSeek 发布了多模态大模型 Janus-Pro，成为全球瞩目的焦点。

从成立到发布多个重要模型，DeepSeek 在短短一年多的时间里，凭借其强大的技术实力和创新能力，在大模型领域迅速崛起，成为了全球 AI 领域不可忽视的力量。

在语言理解与生成方面，DeepSeek 展现出了独特的优势。与 GPT 系列相比，DeepSeek 在中文语境下的表现更加出色，生成的文本更加符合中文的表达习惯和语言逻辑。在撰写一篇关于中国传统文化的文章时，DeepSeek 能够准确地理解相关的文化内涵和历史背景，运用丰富的词汇和恰当的表达方式，生成内容丰富、逻辑连贯的文章，而 GPT 系列可能会出现一些语义偏差或文化背景理解不足的问题。在多轮对话中，DeepSeek 也能够保持较高的连贯性，能够根据前文的内容进行合理的回应，使对话更加自然流畅。

在推理与逻辑能力上，DeepSeek 同样表现稳定。面对复杂的数学问题和逻辑推理任务，它能够迅速分析问题，运用合理的推理方法得出准确的答案。在解决一道复杂的数学证明题时，DeepSeek 能够清晰地阐述推理过程，给出严谨的证明步骤，而 GPT-4 虽然在推理任务中表现较强，但偶尔会出现 “幻觉” 问题，即生成不准确或虚构的内容。

DeepSeek 的训练和推理成本相对较低，这是其在市场竞争中的一大优势。据相关数据显示，OpenAI 训练 ChatGPT-4 的成本高达 7800 万美元甚至可能达到 1 亿美元，而 DeepSeek 大模型的训练成本不到 600 万美元，仅为同性能模型的 5%-10% 。在推理成本方面，DeepSeek 每百万 token 仅需 1 元人民币，而 GPT-4 Turbo 的价格则相对较高。这种成本优势使得 DeepSeek 在市场上具有更强的竞争力，能够吸引更多对成本敏感的企业和用户。

对于企业来说，使用 DeepSeek 可以降低 AI 应用的开发和运营成本，提高企业的经济效益。一些中小企业在进行智能客服系统的开发时，选择使用 DeepSeek 模型，不仅能够满足业务需求，还能够节省大量的成本。低成本也有助于推动 AI 技术的普及和应用，让更多的人能够享受到 AI 带来的便利。

DeepSeek 采取了开源的策略，将其模型及代码以 MIT 协议开源，这一举措对技术发展和社区协作产生了积极的促进作用。通过开源，DeepSeek 吸引了大量的开发者和研究人员参与到项目中，形成了一个活跃的开源社区。

开发者可以根据自己的需求对 DeepSeek 的模型进行定制和优化，将其应用于不同的领域和场景中。在代码生成领域，DeepSeek 支持 338 种编程语言，开发者可以利用其开源模型开发出更加高效的代码生成工具。研究人员也可以在开源的基础上进行进一步的研究和创新，推动 AI 技术的不断发展。开源还

DeepSeek 的开源策略促进了全球人工智能技术的共享与合作，推动了整个行业的技术进步。随着 DeepSeek 等大模型技术的不断发展和应用，人工智能将在更多领域得到普及和深化，为各行业的数字化转型和创新发展提供强大的动力。

DeepSeek火出圈

熱門頭條新聞

其他動漫資訊

動漫世界網絡中國站

DeepSeek火出圈

訂閱電子報

熱門頭條新聞

其他動漫資訊

動漫世界網絡中國站