【人工智能AI瞭望台】DeepSeek吹响生态开放“集结号” 国产AI生态伙伴火速适配,工业富联最新消息,601138最新信息

《 工业富联 601138 》

涨停原因 | 十大股东 | 历史市盈率 | 龙虎榜

财务数据 | 分红股息 | 历史市净率 | 资金流

【人工智能AI瞭望台】DeepSeek吹响生态开放“集结号” 国产AI生态伙伴火速适配
2025-02-05 20:55:00
国产开源大模型DeepSeek凭借出色性价比,成为全球增速最快的AI应用,引发全球科技圈热切讨论和算力信仰震荡,也进一步增强对构建开放型人工智能生态的信心。目前,不仅英伟达、AMD、英特尔等国际芯片巨头宣布集成DeepSeek模型、提供算力支持等,国产GPU厂商、云计算厂商和应用厂商等AI产业链伙伴也火速支持调用DeepSeek,升级各自产品和技术。
  引发算力巨震
  作为幻方量化旗下的AI公司深度求索研发的国产开源大模型,DeepSeek近期连续发布DeepSeek-V3、DeepSeek-R1等AI模型展示了惊艳效果。其中,DeepSeek-V3在多语言编程测试排行榜中,仅次于OpenAIo1大模型,在数学能力方面超过了所有开源闭源模型,而训练成本总计557.6万美元,远低于GPT-4等模型高达数亿美元的训练成本。
  移动应用分析机构SensorTower的数据显示,其应用软件在18天内的下载量达到1600万次,截至2025年2月4日,DeepSeek日活用户数超越了2000万,成为全球增速最快的AI应用。
  人工智能行业业内人士向e公司记者表示,DeepSeek证明了不用堆叠算力也可以搞好大模型。
  综合来看,DeepSeek提供了一种高效的模型蒸馏技术,能够将大规模模型的能力迁移至更小、更高效的版本,并且通过Multi-Head Latent Attention(MLA)和DeepSeek MoE两大核心技术,显著降低显存占用,优化模型性能。
  TrendForce集邦咨询研究指出,DeepSeek采用蒸馏模型(Model Distillation)技术,压缩大型模型以提升推理速度并降低硬件需求,同时充分发挥英伟达Hopper降规版芯片的效益,最大化运算资源利用。其成本优势来自高效能硬件选择、新型蒸馏技术及API开源策略,不仅优化技术与商业应用的平衡,也展现AI产业向高效发展的趋势。
  DeepSeek成为现象级AI应用,也引发了对算力信仰的质疑。全球算力巨头英伟达股价1月27日一度下跌近17%,之后逐步企稳;A股光通讯模块龙头中际旭创1月27日下跌约10%,2月5日进一步放量下跌,工业富联下跌6.76%,寒武纪-U下跌12.46%。
  对此,英伟达此前发表声明,表示DeepSeek所取得的进展显示出其芯片在中国市场的实用价值,且未来为满足DeepSeek的服务需求,还将需要更多英伟达芯片。
  另外,全球数据中心建设还将继续推进,推升光模块需求。TrendForce集邦咨询最新指出,DeepSeek模型虽降低AI训练成本,但AI模型的低成本化可望扩大应用场景,进而增加全球数据中心建设量。光收发模块作为数据中心互连的关键组件,将受惠于高速数据传输的需求,预测2023年400Gbps以上的光收发模块全球出货量为640万个,2024年约2040万个,预估至2025年将超过3190万个,年增长率达56.5%。
  AI芯片积极适配
  对DeepSeek的认可不仅体现在排行榜和用户下载量上,也反映在国际AI芯片巨头的兼容和本土厂商的积极适配。
  1月31日,英伟达发布搭载DeepSeekR1671b的“英伟达NIM微服务”预览版,显著提升AI模型的运行效率,简化企业部署流程,降低AI落地的技术门槛。另外,AMD已将新的DeepSeek-V3模型集成到InstinctMI300XGPU上;英特尔也表示其开发的AI芯片/GPU芯片可以支持DeepSeek,有意与中国芯片合作打破英伟达打造的生态垄断。
  据业内分析,严格意义上,DeepSeek并未离开英伟达的CUDA超级“护城河”,而是使用了英伟达的PTX(Parallel Thread Execution)语言,实现在接近汇编语言的层级运行,通过允许进行细粒度的优化,能够对GPU硬件进行更底层、更精准的控制,从而将英伟达H800GPU的性能发挥到极致,实现了传统基于CUDA的方法难以达到的效率提升。
  前述业内人士向记者表示,把CUDA生态绕过去并没有必要性,只要使用英伟达GPU就会或多或少使用CUDA,但是能够使用PTX证明DeepSeek有能力做到更底层的技术,本质上对国产GPU也是好事。有分析指出,通过精通运用PTX语言,有望帮助国产GPU进行针对性算子优化,提升模型在国产GPU上的运行效率。
  除了国际巨头,海光信息作为国产AI芯片企业,2月4日晚宣布成功完成DeepSeekV3和R1模型与海光AI加速卡DCU的适配并正式上线,有望推动AI技术在更多行业的落地与普及。2月5日,公司股价上涨11.19%。
  另外,潞晨科技携手华为昇腾,联合发布基于昇腾算力的DeepSeekR1系列推理API,及云镜像服务,实现了昇腾算力与DeepSeekR1系列模型的推理适配优化,性能表现与使用高端GPU持平。另外,DeepSeek系列模型正式上线昇腾社区,支持一键获取DeepSeek系列模型,支持昇腾硬件平台上开箱即用,推理快速部署。
  国产GPU厂商沐曦宣布与DeepSeek的合作,摩尔线程宣布部署DeepSeek蒸馏模型推理服务,提升了DeepSeek模型的计算效率和资源利用率;天数智芯宣布适配DeepSeekR1千问蒸馏模型,提供更高效、更稳定的推理服务,满足了不同规模和需求的应用场景。
  2月5日,壁仞科技宣布自主研发的壁砺TM系列产品完成对DeepSeekR1全系列蒸馏模型的支持,涵盖了从1.5B到70B各等级参数版本,包括LLaMA蒸馏模型和千问蒸馏模型,为开发者提供高性能、低成本的大模型部署与开发解决方案。
  云厂商积极扩列
  除了AI硬件端厂商,不少云计算巨头也纷纷入围DeepSeek“朋友圈”,华为云、腾讯云、阿里云、百度云等已经宣布支持部署DeepSeek模型。另外,联通云宣布已基于星罗平台实现国产及主流算力适配多规格DeepSeek-R1模型,兼顾私有化和公有化场景,提供全方位运行服务保障,为客户带来开箱即用的使用体验;实现多产品场景调用,可在全国270多骨干云池预部署,全面接入联通云桌面、编程助手等多产品场景;提供全方位安全服务保障,实时提供抗DDoS等三大安全服务并具备元景安全大模型加持。
  除了云厂商,应用端厂商也在积极探索和部署DeepSeek模型。
  2月4日,万兴科技表示,已完成深度求索(DeepSeek)最新推理大模型DeepSeek-R1的深入适配,旗下视频创意、绘图创意及文档创意软件业务产品,诸如万兴喵影、亿图图示、亿图脑图MindMaster、万兴PDF等均已融合DeepSeek-R1大模型相关能力,用户可抢鲜体验。接入DeepSeek-R1后,用户使用产品的门槛降低,大模型应用的成本也进一步降低。
  另外,北信源公众号显示,其自主研发的“密信AI能力平台”第一时间完成了与DeepSeek的技术对接,这一举措将为信源密信和第三方应用提供DeepSeek大模型AI能力;奇安信宣布已完成与DeepSeek全面深度接入,自研的QAX—GPT安全大模型通过DeepSeekR1优化和蒸馏后,运营成本大幅降低,在威胁研判等多场景下的性能显著提升,安全专业问答整体性能分数提升约16%。
  当虹科技官微显示,公司BlackEye多模态视听大模型正式融合DeepSeek-R1和DeepSeekJanusPro,并完成视听传媒、工业与卫星、车载智能座舱等多行业垂类场景的数据调优训练,可为视听传媒、工业与卫星、车载智能座舱等行业客户提供更低成本的大模型部署及全新的大模型体验。
  易点天下宣布,旗下KreadoAI、数眼智能、zMaticooADX等多款核心产品将融合DeepSeek-R1大模型相关能力,提升用户智能营销体验。
(文章来源:证券时报·e公司)
免责申明: 本站部分内容转载自国内知名媒体,如有侵权请联系客服删除。

【人工智能AI瞭望台】DeepSeek吹响生态开放“集结号” 国产AI生态伙伴火速适配,工业富联最新消息,601138最新信息

sitemap.xml sitemap2.xml