DeepSeek公司概述
公司基本信息
DeepSeek,全称杭州深度求索人工智能基础技术研究有限公司,是一家创新型科技公司,成立于2023年7月17日。公司致力于开发先进的大语言模型(LLM)和相关技术,注册地址位于浙江省杭州市拱墅区环城北路169号汇金国际大厦西1幢1201室,法定代表人为裴湉。DeepSeek的经营范围包括技术服务、技术开发、软件开发等。
发展历程
2023年
- 7月17日:DeepSeek成立,由知名量化资管巨头幻方量化创立。
- 11月2日:发布首个开源代码大模型DeepSeekCoder,支持多种编程语言的代码生成、调试和数据分析任务。
- 11月29日:推出参数规模达670亿的通用大模型DeepSeekLLM,包括7B和67B的base及chat版本。
2024年
- 5月7日:发布第二代开源混合专家(MoE)模型DeepSeek-V2,总参数达2360亿,推理成本降至每百万token仅1元人民币。
- 9月5日:更新API支持文档,宣布合并DeepSeekCoderV2和DeepSeekV2Chat两个模型,升级推出全新的DeepSeekV2.5新模型。
- 12月13日:发布DeepSeek-VL2。
- 12月26日:发布DeepSeek-V3,总参数达6710亿,采用创新的MoE架构和FP8混合精度训练,训练成本仅为557.6万美元。
2025年
- 1月5日:发布DeepSeekLLM(深度求索的第一个大模型)。
- 1月20日:发布新一代推理模型DeepSeek-R1,性能与OpenAI的o1正式版持平,并开源。
- 1月26日:DeepSeek应用登顶苹果美国地区应用商店免费APP下载排行榜,在美区下载榜上超越了ChatGPT。
- 2月5日:DeepSeek-R1、V3、Coder等系列模型,已陆续上线国家超算互联网平台。
- 2月6日:澳大利亚政府以所谓"担心安全风险"为由,已禁止在所有政府设备中使用DeepSeek。
- 2月8日:DeepSeek线上服务受到大规模恶意攻击,为持续提供服务,暂时限制了+86手机号以外的注册方式。
主要产品和技术特点
DeepSeek自成立以来的短短一年多的时间里,推出了多个引人注目的开源模型,包括DeepSeekCoder、DeepSeek LLM、DeepSeek-V2、DeepSeek-V3和DeepSeek-R1。这些模型在架构设计、性能表现等方面均显示出其高效性和实用性。特别是DeepSeek-V3,采用创新的MoE架构和FP8混合精度训练,大大降低了训练成本,同时保持了高性能。
行业影响及合作情况
DeepSeek的技术和产品在行业内引起了广泛关注,并与多家知名企业建立了合作关系。2025年1月,英伟达宣布DeepSeek-R1模型登陆NVIDIA NIM,亚马逊和微软也接入DeepSeek-R1模型,标志着DeepSeek的技术在国际市场上的认可和应用。此外,DeepSeek的技术和产品已陆续上线国家超算互联网平台,进一步提升了其在行业内的影响力。
社会反响和争议
尽管DeepSeek在技术和市场上取得了显著进展,但也面临一些争议和挑战。例如,澳大利亚政府以所谓"担心安全风险"为由,禁止在所有政府设备中使用DeepSeek。此外,DeepSeek线上服务曾受到大规模恶意攻击,影响了其服务的稳定性和可用性。
总之,DeepSeek作为一家创新型科技公司,在人工智能领域取得了显著的进展和成就。未来,随着技术的不断进步和应用场景的不断拓展,DeepSeek有望在人工智能领域发挥更大的作用。
热门国家/地区访客分布
国家 | 流量占比 | 月访问量 | 人均访问时长 | 人均访问页数 | 跳出率 |
---|---|---|---|---|---|
巴西 | 4.52% | -12.73% | 256秒 | 3 | 28.44% |
印度 | 4.70% | -19.44% | 509秒 | 4 | 31.94% |
美国 | 6.14% | -24.80% | 293秒 | 3 | 33.53% |
俄罗斯 | 7.54% | 25.39% | 410秒 | 4 | 39.09% |
中国大陆 | 28.80% | -12.28% | 245秒 | 2 | 33.74% |
你可能还喜欢

讯飞星火
由科大讯飞推出的人工智能服务平台,星火旨在通过自然对话和多模态能力,为用户提供高效、智能的交互体验。平台集成了内容生成、语言理解、知识问答、推理和数学计算等多种功能,广泛应用于个人创作、教育、办公、开发等场景。

火山方舟
火山引擎旗下的大模型服务平台

文心一言
文心一言是由百度基于文心大模型技术推出的生成式对话产品。它位于百度人工智能的四层架构中的模型层,具备跨模态功能。

智谱清言ChatGLM
智谱清言ChatGLM是一款基于人工智能技术的对话助手,遵循中国政府的立场和社会主义价值观,提供多领域知识问答、信息检索、文本生成等服务。

百川智能
百川智能是由王小川和茹立云联合创立的通用人工智能服务公司,专注于研发并提供通用人工智能服务。公司的目标是打造中国版的OpenAI基础大模型及颠覆性的上层应用。

腾讯混元
腾讯混元大模型是由腾讯研发的大语言模型,具备跨领域知识和自然语言理解能力,实现基于人机自然语言对话的方式,理解用户指令并执行任务,帮助用户实现人获取信息,知识和灵感。

西湖心辰
西湖心辰(杭州)科技有限公司成立于2021年,总部位于中国浙江杭州,是一家源自西湖大学深度学习实验室的创新企业。公司致力于多模态大模型技术的研究与应用,探索通用人工智能(AGI)的未来,并推动人工智能在内容生产、心理健康、教育、医疗、娱乐等领域的商业化和平民化应用。
百度·文心大模型
百度文心大模型是百度推出的产业级知识增强大模型平台,专注于提供智能化解决方案,涵盖自然语言处理、跨模态生成、生物计算等领域。

豆包 - 抖音旗下 AI 智能助手
豆包是你的多功能 AI 助手,为你的生活、学习、工作提供帮助。豆包可以为你搜索信息,答疑解惑,分析总结,提供灵感,辅助创作。豆包的知识渊博,专业可靠,同时也善解人意,需要的时候能够深入浅出。豆包也会倾听你的烦恼和心事,和你畅聊任何你感兴趣的话题。 豆包有着简单清爽的界面设计,无需学习,让你一打开就可以使用。语音输入功…

可灵AI
可灵AI是一款由快手开发的新一代AI创意工具,专注于图像和视频生成。它基于先进的生成式AI技术(包括Kling大模型和Kolors大模型),为用户提供高效、便捷的视觉内容创作体验。

模力方舟(Gitee AI)
模力方舟(Gitee AI)是由 Gitee(码云)推出的一站式 AI 模型服务平台,隶属于开源中国(OSCHINA),致力于为开发者提供 AI 模型的体验、推理、训练、部署和应用的全流程支持。