Deepseek 大模型

About 79,400 results

Open links in new tab

Any time

deepseek.com
https://www.deepseek.com
DeepSeek
DeepSeek, unravel the mystery of AGI with curiosity. Answer the essential question with long-termism. 🎉 DeepSeek-R1 is now live and open source, rivaling OpenAI's Model o1.
github.com
https://github.com › deepseek-ai
deepseek-ai/DeepSeek-V3 - GitHub
We present DeepSeek-V3, a strong Mixture-of-Experts (MoE) language model with 671B total parameters with 37B activated for each token. To achieve efficient inference and cost-effective training, DeepSeek-V3 adopts Multi-head Latent Attention (MLA) and DeepSeekMoE architectures, which were thoroughly validated in DeepSeek-V2.
deepseek.com
https://api-docs.deepseek.com › zh-cn › news
DeepSeek-V3 正式发布 | DeepSeek API Docs
Jul 25, 2024 · DeepSeek-V3 正式发布. 今天，我们全新系列模型 DeepSeek-V3 首个版本上线并同步开源。登录官网 chat.deepseek.com 即可与最新版 V3 模型对话。API 服务已同步更新，接口配置无需改动。当前版本的 DeepSeek-V3 暂不支持多模态输入输出。
zhihu.com
https://zhuanlan.zhihu.com
解读：DeepSeek-V3模型牛在哪里？怎么做到的？ - 知乎专栏
Jan 3, 2025 · 2024年12月26日，幻方（国内最大的私募基金）旗下的大模型公司DeepSeek（深度求索）推出了全新开源模型DeepSeek-V3，随后就在国内外AI圈刷了屏。由于DeepSeek比较低调，很多人会有出其不意的感觉。
zhihu.com
https://zhuanlan.zhihu.com
可能是最强的开源代码大模型！深度求索发布 DeepSeek Coder
成立半年后，DeepSeek 带着代码大模型与大家见面了。免费商用，完全开源。 DeepSeek 智能代码助手. Talk is cheap, show me the code. 进入 DeepSeek Coder 对话界面，输入：用 Python 写一个贪吃蛇游戏，随着屏幕快速输出跳跃的代码，一段可直接运行的游戏代码即可生成：
csdn.net
https://blog.csdn.net › article › details
DeepSeek大模型技术解析：从架构到应用的全面探索-CSDN博客
Jan 28, 2025 · DeepSeek大模型是由北京深度求索人工智能基础技术研究有限公司开发的一款基于Transformer架构的大型语言模型。它具备强大的自然语言理解和生成能力，能够处理多种复杂的语言任务，如智能对话、文本生成、语义理解等。
zhihu.com
https://zhuanlan.zhihu.com
深度求索发布DeepSeek：高效、低成本的开源大语言模型 - 知乎
Dec 30, 2024 · DeepSeek-V3 是一款基于混合专家（MoE）架构的大语言模型，总参数量高达6710亿，每次推理仅激活370亿参数，显著降低了计算开销。其训练数据规模为14.8万亿高质量 token，涵盖了数学、编程、中文等多个领域，确保了模型的广泛适用性。
datalearner.com
https://www.datalearner.com › blog
开源大模型的新里程碑：DeepSeek AI开源6510亿参数的DeepSeek …
Dec 27, 2024 · 开源大模型的新里程碑：DeepSeek AI开源6510亿参数的DeepSeek V3模型，评测结果显著好于4050亿参数的Llama3.1 405B，比肩Sonnet 3.5的开源模型标签： ## 时间：2024/12/27 19:48:09 作者：小木
csdn.net
https://blog.csdn.net › xiaoliouc › article › details
【AI+大模型】从媲美GPT4能力的国产DeepSeek-V2浅聊MOE模型_deepseek …
May 12, 2024 · 5月6日，私募巨头幻方量化官微宣布，其探索AGI（通用人工智能）的新组织“深度求索（DeepSeek）”正式开源。媲美GPT4能力. 在目前大模型主流榜单中，DeepSeek-V2均表现出色:
dw.com
https://www.dw.com › zh-hant › 專訪deepseek為何能在ai大模型中...
專訪：DeepSeek為何能在AI大模型中脫穎而出 – DW – 2025年2 …
Feb 1, 2025 · DeepSeek以「AI大模型圈黑馬「迅猛崛起，如何以低成本推出頂級模型？DeepSeek的成功是否意味著中國在AI領域趕超美國？歐洲AI領域為何相對落後？
Pagination
- 1
- 2
- 3
- 4

DeepSeek

deepseek-ai/DeepSeek-V3 - GitHub

DeepSeek-V3 正式发布 | DeepSeek API Docs

解读：DeepSeek-V3模型牛在哪里？怎么做到的？ - 知乎专栏

可能是最强的开源代码大模型！深度求索发布 DeepSeek Coder

DeepSeek大模型技术解析：从架构到应用的全面探索-CSDN博客

深度求索发布DeepSeek：高效、低成本的开源大语言模型 - 知乎

开源大模型的新里程碑：DeepSeek AI开源6510亿参数的DeepSeek …

【AI+大模型】从媲美GPT4能力的国产DeepSeek-V2浅聊MOE模型_deepseek …

專訪：DeepSeek為何能在AI大模型中脫穎而出 – DW – 2025年2 …