2024年12月以来,DeepSeek先后发布开源大语言模型DeepSeek-V3、推理模型DeepSeek-R1,因为低成本、高性能、开源开放等特性迅速登顶苹果中美地区应用商店免费APP下载排行榜,国内外多家科技巨头以及政务、教育、医疗(医疗用品行业分析报告)等领域纷纷接入DeepSeek模型。
据分析,DeepSeek-V3模型训练成本不到OpenAI同性能模型GPT-4的十分之一,DeepSeek-R1模型训练成本仅为OpenAI o1模型的3%至5%。在推理方面,DeepSeek-R1模型的使用成本是OpenAI o1模型的三十分之一。此外,DeepSeek通过算法优化、效率提升等工程技术创新,以较低成本有效提升了性能,打破了“堆算力、拼数据”的传统路径。
赛迪智库信息化与软件产业研究所所长韩健认为,DeepSeek的成功,标志着我国在大模型领域走出了一条“低成本、高性能”创新之路,为全球人工智能发展提供了新的发展范式。以DeepSeek为代表的我国人工智能技术创新再次取得突破性进展,不仅在全球大模型性能竞赛中表现卓越,还为全球大模型开源贡献了中国力量。同时,大幅降低了大模型应用成本,推动我国人工智能大模型技术进入规模化应用的新发展阶段。
DeepSeek在推动大模型降低成本方面的贡献,将有力促进以大模型为代表的人工智能技术赋能千行百业,“人工智能+”行动将加速走深向实。此外,DeepSeek开源开放的发展路径,吸引产业链上下游企业快速跟进,有望促进形成芯片、云计算、模型等协同突破的链式创新态势,加速构建良好产业生态。具有更高效率和更低成本的人工智能技术加速了个人智能,尤其是端侧智能、边缘侧智能的成熟进程,也促进并加速了人工智能在企业的部署应用。目前,联想人工智能电脑、人工智能手机和人工智能平板已全面接入云端DeepSeek-R1联网满血版大模型,并将率先在端侧本地部署DeepSeek大模型。