![](/rp/kFAqShRrnkQMbH6NYLBYoJ3lq9s.png)
DeepSeek
DeepSeek, unravel the mystery of AGI with curiosity. Answer the essential question with long-termism. 🎉 DeepSeek-R1 is now live and open source, rivaling OpenAI's Model o1.
deepseek-ai/DeepSeek-V3 - GitHub
We present DeepSeek-V3, a strong Mixture-of-Experts (MoE) language model with 671B total parameters with 37B activated for each token. To achieve efficient inference and cost-effective training, DeepSeek-V3 adopts Multi-head Latent Attention (MLA) and DeepSeekMoE architectures, which were thoroughly validated in DeepSeek-V2.
DeepSeek-V3 正式发布 | DeepSeek API Docs
Jul 25, 2024 · DeepSeek-V3 正式发布. 今天,我们全新系列模型 DeepSeek-V3 首个版本上线并同步开源。 登录官网 chat.deepseek.com 即可与最新版 V3 模型对话。API 服务已同步更新,接口配置无需改动。当前版本的 DeepSeek-V3 暂不支持多模态输入输出。
解读:DeepSeek-V3模型牛在哪里?怎么做到的? - 知乎专栏
Jan 3, 2025 · 2024年12月26日, 幻方 (国内最大的私募基金)旗下的大模型公司DeepSeek(深度求索)推出了全新开源模型DeepSeek-V3,随后就在国内外AI圈刷了屏。 由于DeepSeek比较低调,很多人会有出其不意的感觉。
可能是最强的开源代码大模型!深度求索发布 DeepSeek Coder
成立半年后,DeepSeek 带着代码大模型与大家见面了。免费商用,完全开源。 DeepSeek 智能代码助手. Talk is cheap, show me the code. 进入 DeepSeek Coder 对话界面,输入:用 Python 写一个贪吃蛇游戏,随着屏幕快速输出跳跃的代码,一段可直接运行的 游戏代码 即可生成:
DeepSeek大模型技术解析:从架构到应用的全面探索-CSDN博客
Jan 28, 2025 · DeepSeek大模型是由北京深度求索人工智能基础技术研究有限公司开发的一款基于Transformer架构的大型语言模型。 它具备强大的自然语言理解和生成能力,能够处理多种复杂的语言任务,如智能对话、文本生成、语义理解等。
深度求索发布DeepSeek:高效、低成本的开源大语言模型 - 知乎
Dec 30, 2024 · DeepSeek-V3 是一款基于混合专家(MoE)架构的 大语言模型 ,总参数量高达6710亿,每次推理仅激活370亿参数,显著降低了计算开销。其训练数据规模为14.8万亿高质量 token,涵盖了数学、编程、中文等多个领域,确保了模型的广泛适用性。
开源大模型的新里程碑:DeepSeek AI开源6510亿参数的DeepSeek …
Dec 27, 2024 · 开源大模型的新里程碑:DeepSeek AI开源6510亿参数的DeepSeek V3模型,评测结果显著好于4050亿参数的Llama3.1 405B,比肩Sonnet 3.5的开源模型 标签: ## 时间:2024/12/27 19:48:09 作者:小木
【AI+大模型】从媲美GPT4能力的国产DeepSeek-V2浅聊MOE模型_deepseek …
May 12, 2024 · 5月6日,私募巨头幻方量化官微宣布,其探索AGI(通用人工智能)的新组织“深度求索(DeepSeek)”正式开源。 媲美GPT4能力. 在目前大模型主流榜单中,DeepSeek-V2均表现出色:
專訪:DeepSeek為何能在AI大模型中脫穎而出 – DW – 2025年2 …
Feb 1, 2025 · DeepSeek以「AI大模型圈黑馬「迅猛崛起,如何以低成本推出頂級模型?DeepSeek的成功是否意味著中國在AI領域趕超美國?歐洲AI領域為何相對落後?