DeepSeek

纠错

月访问量: 6.15亿 同比上月: 121.21%

DeepSeek-V3 在推理速度上相较历史模型有了大幅提升。

DeepSeek公司概述

公司基本信息

DeepSeek,全称杭州深度求索人工智能基础技术研究有限公司,是一家创新型科技公司,成立于2023年7月17日。公司致力于开发先进的大语言模型(LLM)和相关技术,注册地址位于浙江省杭州市拱墅区环城北路169号汇金国际大厦西1幢1201室,法定代表人为裴湉。DeepSeek的经营范围包括技术服务、技术开发、软件开发等。

发展历程

2023年

  • 7月17日:DeepSeek成立,由知名量化资管巨头幻方量化创立。
  • 11月2日:发布首个开源代码大模型DeepSeekCoder,支持多种编程语言的代码生成、调试和数据分析任务。
  • 11月29日:推出参数规模达670亿的通用大模型DeepSeekLLM,包括7B和67B的base及chat版本。

2024年

  • 5月7日:发布第二代开源混合专家(MoE)模型DeepSeek-V2,总参数达2360亿,推理成本降至每百万token仅1元人民币。
  • 9月5日:更新API支持文档,宣布合并DeepSeekCoderV2和DeepSeekV2Chat两个模型,升级推出全新的DeepSeekV2.5新模型。
  • 12月13日:发布DeepSeek-VL2。
  • 12月26日:发布DeepSeek-V3,总参数达6710亿,采用创新的MoE架构和FP8混合精度训练,训练成本仅为557.6万美元。

2025年

  • 1月5日:发布DeepSeekLLM(深度求索的第一个大模型)。
  • 1月20日:发布新一代推理模型DeepSeek-R1,性能与OpenAI的o1正式版持平,并开源。
  • 1月26日:DeepSeek应用登顶苹果美国地区应用商店免费APP下载排行榜,在美区下载榜上超越了ChatGPT。
  • 2月5日:DeepSeek-R1、V3、Coder等系列模型,已陆续上线国家超算互联网平台。
  • 2月6日:澳大利亚政府以所谓"担心安全风险"为由,已禁止在所有政府设备中使用DeepSeek。
  • 2月8日:DeepSeek线上服务受到大规模恶意攻击,为持续提供服务,暂时限制了+86手机号以外的注册方式。

主要产品和技术特点

DeepSeek自成立以来的短短一年多的时间里,推出了多个引人注目的开源模型,包括DeepSeekCoder、DeepSeek LLM、DeepSeek-V2、DeepSeek-V3和DeepSeek-R1。这些模型在架构设计、性能表现等方面均显示出其高效性和实用性。特别是DeepSeek-V3,采用创新的MoE架构和FP8混合精度训练,大大降低了训练成本,同时保持了高性能。

行业影响及合作情况

DeepSeek的技术和产品在行业内引起了广泛关注,并与多家知名企业建立了合作关系。2025年1月,英伟达宣布DeepSeek-R1模型登陆NVIDIA NIM,亚马逊和微软也接入DeepSeek-R1模型,标志着DeepSeek的技术在国际市场上的认可和应用。此外,DeepSeek的技术和产品已陆续上线国家超算互联网平台,进一步提升了其在行业内的影响力。

社会反响和争议

尽管DeepSeek在技术和市场上取得了显著进展,但也面临一些争议和挑战。例如,澳大利亚政府以所谓"担心安全风险"为由,禁止在所有政府设备中使用DeepSeek。此外,DeepSeek线上服务曾受到大规模恶意攻击,影响了其服务的稳定性和可用性。

总之,DeepSeek作为一家创新型科技公司,在人工智能领域取得了显著的进展和成就。未来,随着技术的不断进步和应用场景的不断拓展,DeepSeek有望在人工智能领域发挥更大的作用。

上月数据概览

月访问量6.15亿月活1.12亿月活(去重)9242.44万
月PV23.28亿平均访问时长295秒跳出率32.62%
人均访问次数5.50对比上月121.21%人均访问页面数3

热门国家/地区访客分布

国家流量占比月访问量人均访问时长人均访问页数跳出率
俄罗斯
2.67%
83.76%
374秒439.70%
巴西
3.95%
144.71%
280秒327.35%
印度
6.19%
79.09%
423秒429.84%
美国
7.63%
87.61%
278秒330.28%
中国大陆
33.85%
261.32%
282秒332.53%

同类推荐