DeepSeek | 小木导航

深度求索（DeepSeek）是一间中国的人工智慧（AI）公司，成立于 2023 年，目标是打造「通用人工智慧」（AGI）。 DeepSeek 专注于研发最先进的AI 技术，特别是「自然语言处理」（NLP）和「深度学习」，AI技术可以让机器理解人类语言、生成文字、进行对话，甚至解决更复杂的问题，像是聊天机器人、文本生成、语文翻译、整理资料…。

DeepSeek 主要创新核心技术

DeepSeek 的技术核心是「大语言模型」（LLM），类似于 OpenAI 的 GPT 或 Google 的 BERT，但他们更专注于实现 AGI，让 AI 变得更通用、更智能。这意味着他们的技术不仅能处理语言，未来还能应用在更多领域，比如医疗诊断、金融分析、教育辅助等，DeepSeek 为了让电脑在处理大量资料时，能够更省记忆体、更快运算，并且适合处理复杂的任务，比如长篇文章或多轮对话，所以使用了以下技术。

多头注意力 Multi-head Latent Attention (MLA)

目标：让电脑处理很长的文字时，减少记忆体的使用，并且加快处理速度。
方法：透过一种叫做「低秩因子分解(Low-Rank Factorization)」的技术，把需要记住的资料变小，这样记忆体需求就降低了。例如，原本需要很多记忆体，现在可以减少30%。
应用：适合处理很长的文章或对话，比如法律文件或多轮对话。

混合专家(MoE)架构

目标：让电脑在处理复杂任务时更有效率。
方法：DeepSeek 用了一种叫「混合专家模型」（MoE）的技术，简单来说，就是让电脑在处理任务时，不需要动用全部的资源，只启动一部分来工作就好。举个例子，DeepSeek 的 R1 模型虽然总共有 6710 亿个参数（可以想像成它的「脑容量」很大），但每次处理任务时，只会用到其中大约 370 亿个参数。
特点：这样的好处是，电脑跑得更快，而且还更省电、更省钱。

FP8 高效能使用记忆体

目标：让电脑在训练模型时，减少记忆体使用并加快运算速度。
方法：DeepSeek 用了 FP8 混合精度训练框架，这个技术比传统的 FP16 和 FP32 更省记忆体，让训练和推理的速度更快、效率更高。
通讯优化：在多个 GPU 之间传输资料时，使用一种叫做「DualPipe」的技术，让资料传输更顺畅，减少等待时间，提升整体效率。

什么是 AGI?

AGI是「人工通用智慧」的英文简写，全名为Artificial General Intelligence，AGI就是让AI 像人类一样聪明，能够理解、学习并完成各种复杂任务，而不只是单一功能，AGI跟AI最大的分别就是AGI会像人一样的思考，有人类的自我意识，AGI还在开发中，目前看到的都是AI只能完成某一些特定任务，像是文本生成、图片生成、声音生成、影片生成… 。

DeepSeek 跟 ChatGPT 有什么不一样？

DeepSeek 和 ChatGPT 都是超厉害的 AI 语言模型，但它们在开发背景、技术特点和应用场景上有些不同，以下是比较表。

DeepSeek、ChatGPT 比较表

项目	DeepSeek	ChatGPT
开发公司	深度求索（中国）	OpenAI（美国）
成立时间	2023年	2015年
开发时间	较新，技术仍在快速发展中	较成熟，已迭代多个版本(GPT-1 到 GPT-4)
开发成本	未公开，可能投入大量资源于 AGI 研究	数亿美元(包括硬体、数据和研发)
训练成本	558万美元(DeepSeek-V3)	10 亿美元(GPT-4o)
目标	实现通用人工智慧(AGI)	开发强大的自然语言生成模型
核心技术	深度学习、自然语言处理、多任务处理	GPT架构(Generative Pre-trained Transformer)
语言优势	中文处理优化	英文处理优化
开源情况	DeepSeek-R1(开源)、API(收费)	旧模型(GPT-2)开源，新模型(GPT-3、GPT-4)闭源、API(收费)
免费版	目前无明确免费版资讯	有免费版，但功能有限要排队
付费版	价钱尚未公开，可能按使用量收费	ChatGPT Plus：每月 20 美元(约 600 台币)
API价钱	0.14 美元(输入)	2.5 美元(输入)
应用场景	多任务处理、专业领域问答、中文环境	文字生成、对话系统、英文环境
对话能力	强调多轮对话和复杂问题解决	擅长生成连贯、自然的对话内容
文本生成能力	支援中文文本生成，质量高	英文文本生成能力极强
翻译能力	中文翻译优化	英文翻译优化
企业合作	可能专注于中国市场和企业合作	全球范围内合作，企业应用广泛
未来发展	专注于 AGI，目标是更通用的 AI	持续优化语言模型，扩展应用场景
硬体需求	未公开，可能需高效能计算资源	需要大量 GPU 和高效能计算资源
数据来源	未公开，可能包含大量中文数据	来自网路文本、书籍、文章等多种来源
用户评价	尚在发展中，用户评价较少	全球用户评价高，尤其英文用户

去官方网站了解更多

DeepSeek最新版