小贴士:按下Ctrl+D 或 ⌘+D,一键收藏本站,方便下次快速访问!

DeepSeek

月访问量: 4.36亿-9.14%
DeepSeek-V3 在推理速度上相较历史模型有了大幅提升。

DeepSeek公司概述

公司基本信息

DeepSeek,全称杭州深度求索人工智能基础技术研究有限公司,是一家创新型科技公司,成立于2023年7月17日。公司致力于开发先进的大语言模型(LLM)和相关技术,注册地址位于浙江省杭州市拱墅区环城北路169号汇金国际大厦西1幢1201室,法定代表人为裴湉。DeepSeek的经营范围包括技术服务、技术开发、软件开发等。

发展历程

2023年

  • 7月17日:DeepSeek成立,由知名量化资管巨头幻方量化创立。
  • 11月2日:发布首个开源代码大模型DeepSeekCoder,支持多种编程语言的代码生成、调试和数据分析任务。
  • 11月29日:推出参数规模达670亿的通用大模型DeepSeekLLM,包括7B和67B的base及chat版本。

2024年

  • 5月7日:发布第二代开源混合专家(MoE)模型DeepSeek-V2,总参数达2360亿,推理成本降至每百万token仅1元人民币。
  • 9月5日:更新API支持文档,宣布合并DeepSeekCoderV2和DeepSeekV2Chat两个模型,升级推出全新的DeepSeekV2.5新模型。
  • 12月13日:发布DeepSeek-VL2。
  • 12月26日:发布DeepSeek-V3,总参数达6710亿,采用创新的MoE架构和FP8混合精度训练,训练成本仅为557.6万美元。

2025年

  • 1月5日:发布DeepSeekLLM(深度求索的第一个大模型)。
  • 1月20日:发布新一代推理模型DeepSeek-R1,性能与OpenAI的o1正式版持平,并开源。
  • 1月26日:DeepSeek应用登顶苹果美国地区应用商店免费APP下载排行榜,在美区下载榜上超越了ChatGPT。
  • 2月5日:DeepSeek-R1、V3、Coder等系列模型,已陆续上线国家超算互联网平台。
  • 2月6日:澳大利亚政府以所谓"担心安全风险"为由,已禁止在所有政府设备中使用DeepSeek。
  • 2月8日:DeepSeek线上服务受到大规模恶意攻击,为持续提供服务,暂时限制了+86手机号以外的注册方式。

主要产品和技术特点

DeepSeek自成立以来的短短一年多的时间里,推出了多个引人注目的开源模型,包括DeepSeekCoder、DeepSeek LLM、DeepSeek-V2、DeepSeek-V3和DeepSeek-R1。这些模型在架构设计、性能表现等方面均显示出其高效性和实用性。特别是DeepSeek-V3,采用创新的MoE架构和FP8混合精度训练,大大降低了训练成本,同时保持了高性能。

行业影响及合作情况

DeepSeek的技术和产品在行业内引起了广泛关注,并与多家知名企业建立了合作关系。2025年1月,英伟达宣布DeepSeek-R1模型登陆NVIDIA NIM,亚马逊和微软也接入DeepSeek-R1模型,标志着DeepSeek的技术在国际市场上的认可和应用。此外,DeepSeek的技术和产品已陆续上线国家超算互联网平台,进一步提升了其在行业内的影响力。

社会反响和争议

尽管DeepSeek在技术和市场上取得了显著进展,但也面临一些争议和挑战。例如,澳大利亚政府以所谓"担心安全风险"为由,禁止在所有政府设备中使用DeepSeek。此外,DeepSeek线上服务曾受到大规模恶意攻击,影响了其服务的稳定性和可用性。

总之,DeepSeek作为一家创新型科技公司,在人工智能领域取得了显著的进展和成就。未来,随着技术的不断进步和应用场景的不断拓展,DeepSeek有望在人工智能领域发挥更大的作用。

热门国家/地区访客分布

国家流量占比月访问量人均访问时长人均访问页数跳出率
巴西
4.52%
-12.73%
256秒328.44%
印度
4.70%
-19.44%
509秒431.94%
美国
6.14%
-24.80%
293秒333.53%
俄罗斯
7.54%
25.39%
410秒439.09%
中国大陆
28.80%
-12.28%
245秒233.74%

你可能还喜欢

讯飞星火

由科大讯飞推出的人工智能服务平台,星火旨在通过自然对话和多模态能力,为用户提供高效、智能的交互体验。平台集成了内容生成、语言理解、知识问答、推理和数学计算等多种功能,广泛应用于个人创作、教育、办公、开发等场景。

火山方舟

火山引擎旗下的大模型服务平台

文心一言

文心一言是由百度基于文心大模型技术推出的生成式对话产品。它位于百度人工智能的四层架构中的模型层,具备跨模态功能。

智谱清言ChatGLM

智谱清言ChatGLM是一款基于人工智能技术的对话助手,遵循中国政府的立场和社会主义价值观,提供多领域知识问答、信息检索、文本生成等服务。

百川智能

百川智能是由王小川和茹立云联合创立的通用人工智能服务公司,专注于研发并提供通用人工智能服务。公司的目标是打造中国版的OpenAI基础大模型及颠覆性的上层应用。

腾讯混元

腾讯混元大模型是由腾讯研发的大语言模型,具备跨领域知识和自然语言理解能力,实现基于人机自然语言对话的方式,理解用户指令并执行任务,帮助用户实现人获取信息,知识和灵感。

西湖心辰

西湖心辰(杭州)科技有限公司成立于2021年,总部位于中国浙江杭州,是一家源自西湖大学深度学习实验室的创新企业。公司致力于多模态大模型技术的研究与应用,探索通用人工智能(AGI)的未来,并推动人工智能在内容生产、心理健康、教育、医疗、娱乐等领域的商业化和平民化应用。

百度·文心大模型

百度文心大模型是百度推出的产业级知识增强大模型平台,专注于提供智能化解决方案,涵盖自然语言处理、跨模态生成、生物计算等领域。

豆包 - 抖音旗下 AI 智能助手

豆包是你的多功能 AI 助手,为你的生活、学习、工作提供帮助。豆包可以为你搜索信息,答疑解惑,分析总结,提供灵感,辅助创作。豆包的知识渊博,专业可靠,同时也善解人意,需要的时候能够深入浅出。豆包也会倾听你的烦恼和心事,和你畅聊任何你感兴趣的话题。 豆包有着简单清爽的界面设计,无需学习,让你一打开就可以使用。语音输入功…

可灵AI

可灵AI是一款由快手开发的新一代AI创意工具,专注于图像和视频生成。它基于先进的生成式AI技术(包括Kling大模型和Kolors大模型),为用户提供高效、便捷的视觉内容创作体验。

模力方舟(Gitee AI)

模力方舟(Gitee AI)是由 Gitee(码云)推出的一站式 AI 模型服务平台,隶属于开源中国(OSCHINA),致力于为开发者提供 AI 模型的体验、推理、训练、部署和应用的全流程支持。