
DeepSeek公司概述
公司基本信息
DeepSeek,全称杭州深度求索人工智能基础技术研究有限公司,是一家创新型科技公司,成立于2023年7月17日。公司致力于开发先进的大语言模型(LLM)和相关技术,注册地址位于浙江省杭州市拱墅区环城北路169号汇金国际大厦西1幢1201室,法定代表人为裴湉。DeepSeek的经营范围包括技术服务、技术开发、软件开发等。
发展历程
2023年
- 7月17日:DeepSeek成立,由知名量化资管巨头幻方量化创立。
- 11月2日:发布首个开源代码大模型DeepSeekCoder,支持多种编程语言的代码生成、调试和数据分析任务。
- 11月29日:推出参数规模达670亿的通用大模型DeepSeekLLM,包括7B和67B的base及chat版本。
2024年
- 5月7日:发布第二代开源混合专家(MoE)模型DeepSeek-V2,总参数达2360亿,推理成本降至每百万token仅1元人民币。
- 9月5日:更新API支持文档,宣布合并DeepSeekCoderV2和DeepSeekV2Chat两个模型,升级推出全新的DeepSeekV2.5新模型。
- 12月13日:发布DeepSeek-VL2。
- 12月26日:发布DeepSeek-V3,总参数达6710亿,采用创新的MoE架构和FP8混合精度训练,训练成本仅为557.6万美元。
2025年
- 1月5日:发布DeepSeekLLM(深度求索的第一个大模型)。
- 1月20日:发布新一代推理模型DeepSeek-R1,性能与OpenAI的o1正式版持平,并开源。
- 1月26日:DeepSeek应用登顶苹果美国地区应用商店免费APP下载排行榜,在美区下载榜上超越了ChatGPT。
- 2月5日:DeepSeek-R1、V3、Coder等系列模型,已陆续上线国家超算互联网平台。
- 2月6日:澳大利亚政府以所谓"担心安全风险"为由,已禁止在所有政府设备中使用DeepSeek。
- 2月8日:DeepSeek线上服务受到大规模恶意攻击,为持续提供服务,暂时限制了+86手机号以外的注册方式。
主要产品和技术特点
DeepSeek自成立以来的短短一年多的时间里,推出了多个引人注目的开源模型,包括DeepSeekCoder、DeepSeek LLM、DeepSeek-V2、DeepSeek-V3和DeepSeek-R1。这些模型在架构设计、性能表现等方面均显示出其高效性和实用性。特别是DeepSeek-V3,采用创新的MoE架构和FP8混合精度训练,大大降低了训练成本,同时保持了高性能。
行业影响及合作情况
DeepSeek的技术和产品在行业内引起了广泛关注,并与多家知名企业建立了合作关系。2025年1月,英伟达宣布DeepSeek-R1模型登陆NVIDIA NIM,亚马逊和微软也接入DeepSeek-R1模型,标志着DeepSeek的技术在国际市场上的认可和应用。此外,DeepSeek的技术和产品已陆续上线国家超算互联网平台,进一步提升了其在行业内的影响力。
社会反响和争议
尽管DeepSeek在技术和市场上取得了显著进展,但也面临一些争议和挑战。例如,澳大利亚政府以所谓"担心安全风险"为由,禁止在所有政府设备中使用DeepSeek。此外,DeepSeek线上服务曾受到大规模恶意攻击,影响了其服务的稳定性和可用性。
总之,DeepSeek作为一家创新型科技公司,在人工智能领域取得了显著的进展和成就。未来,随着技术的不断进步和应用场景的不断拓展,DeepSeek有望在人工智能领域发挥更大的作用。
热门国家/地区访客分布
国家 | 流量占比 | 月访问量 | 人均访问时长 | 人均访问页数 | 跳出率 |
---|---|---|---|---|---|
俄罗斯 | 3.76% | 17.10% | 373秒 | 3 | 40.86% |
巴西 | 4.62% | -2.97% | 267秒 | 3 | 29.25% |
印度 | 5.13% | -31.10% | 449秒 | 4 | 29.57% |
美国 | 7.58% | -17.51% | 272秒 | 3 | 32.01% |
中国大陆 | 33.92% | -16.78% | 243秒 | 2 | 34.79% |
©版权声明: 本网站(猫目,网址:https://maomu.com/ )所有内容,包括但不限于文字、图片、图标、数据、产品描述、页面设计及代码,均受中华人民共和国著作权法及国际版权法律保护,归本站所有。未经书面授权,任何个人、组织或机构不得以任何形式复制、转载、修改、传播或用于商业用途。 对于任何侵犯本网站版权的行为,我们保留追究其法律责任的权利,包括但不限于要求停止侵权、赔偿损失及提起诉讼。