慧博投研近日发布研究报告,对人工智能公司DeepSeek进行点评,其主要内容包括:DeepSeek的发展现状、市场表现、技术创新、应用场景、产业机遇、相关公司分析以及未来展望等方面。
DeepSeek成立于2023年,是幻方量化的子公司。自成立以来,其不断研发迭代大模型,产品体系日益丰富。
例如,DeepSeek-v3在大模型主流榜单的开源模型中位列榜首,与世界先进闭源模型不分伯仲;推理模型R1性能对标OpenAI的o1正式版,在多领域表现卓越。而且,DeepSeek主打“极致性价比”,训练费用仅557.6万美元,是GPT-4o的十分之一,API调用成本只有OpenAI的三十分之一。同时,英伟达、微软、华为云等科技巨头纷纷接入DeepSeek,推动全球AI生态发展。

在市场表现上,DeepSeek-V3多项评测成绩超越众多开源模型,在知识类任务、长文本评测、算法类代码场景等方面表现出色,生成吐字速度提升至60TPS,API服务定价也极具性价比。R1模型在推理能力上比肩OpenAI o1,开源多个模型并支持“模型蒸馏”,上线API和APP,服务定价远低于OpenAI o1。两款模型推出后,DeepSeek成为全球增速最快的AI应用,上线18天日活达1500万,增速是ChatGPT的13倍。

技术创新是DeepSeek的核心竞争力。它采用模型蒸馏技术提升小模型推理能力,效果优于强化学习,还通过视觉解耦统一多模态理解和生成。在架构设计上,多头潜注意力(MLA)、深度求索混合专家系统(DeepSeekMoE)等创新架构降低了内存占用和计算量。
同时,在模型层、架构层、训练层和推理层进行多层面技术提升,如采用MoE架构、引入无辅助损失的负载均衡策略、使用DualPipe算法和FP8混合精度训练、迁移R1推理能力等,使模型在性能和效率上取得显著提升。
DeepSeek的技术创新推动了AI在多行业的应用。
在AI+影视领域,可降低影视制作成本和时间,从剧本生成到后期制作都有应用;AI+游戏方面,能提升游戏开发效率和体验,自动生成游戏资产,优化渲染效果;AI+社交陪伴中,虚拟助手和角色可提供情感支持和个性化服务;AI+电商可实现精准推荐和自动化客户服务,优化运营;AI+营销领域,能实现个性化营销策略,生成高质量营销内容。
产业机遇方面,DeepSeek的开源属性促使AI产业链企业加速适配,云厂商纷纷上线其模型。“Jevons悖论”表明,其技术突破可能带动算力需求提升,第三方云厂有望受益于模型平权。同时,DeepSeek推动端侧推理成本压缩,在AI眼镜、耳机、学习机、玩具等端侧设备上应用前景广阔。
相关公司中,国产算力及算力服务企业如
润建股份(002929)、
中科曙光(603019)、
海光信息(688041)等积极布局。
润建股份部署DeepSeek赋能智能体应用开发,算力业务发展良好;
中科曙光业绩稳健,计算产业生态持续完善;
海光信息DCU产品快速迭代,完成DeepSeek模型适配。
AI应用类企业如
金山办公(688111)、
彩讯股份(300634)、
同花顺(300033)也借助DeepSeek发展。
金山办公智能化、国产化、云化协同发展;
彩讯股份布局Rich AI超级工厂;
同花顺深耕金融信息服务,布局AI大模型及应用。
展望未来,DeepSeek有望推动AI平权时代到来,加速应用端发展,其开源大模型生态或成为AI时代的Android。它还将推动AI生态繁荣,实现高质量模型平价化,拉高模型能力下限,加速AI行业迭代。然而,美国持续加码AI出口管制,限制DeepSeek使用,中国AI产业面临芯片瓶颈,突破先进制程、实现半导体自主可控至关重要。

(文章来源:财中社)