DeepSeek-R1,一款在“蛇年”春节备受瞩目的AI新秀,因在数学、代码及推理任务上的出色表现,迅速成为业界焦点。
记者获悉,DeepSeek日前正式登陆江苏省苏州市、无锡市、常州市等多地的算力平台,为有本地化部署、模型定制微调需求的企业及个人用户提供服务。
DeepSeek登陆多地“算力超市”
据苏州发布,苏州数智科技集团近日在苏州市公共算力服务平台上架了基于英伟达算力部署的DeepSeek-R1模型和基于华为昇腾算力部署的DeepSeek-V3模型。同时,提供基于DeepSeek模型的一体机,针对有本地化部署需求的用户提供开箱即用的软硬件一体服务。
在常州市,
中国移动长三角(常州)智算中心日前也完成了DeepSeek的部署上线。据常州发布,常州移动数智化支撑中心率先完成DeepSeek-R1-70B模型的本地部署工作,并与合作伙伴合力打造了320台DeepSeek高配云主机。
据悉,
中国移动长三角(常州)智算中心2024年5月正式落地常州钟楼区,一期对外运营算力规模达230PB,可满足AI场景下的多元需求。
今年1月15日,无锡太湖亿芯智算中心正式投入运营,目前已上线基于燧原科技算力的DeepSeek全系列开源模型推理服务。2月9日,由无锡数据集团建设运营的无锡“算力超市”(无锡算力公共服务平台)也正式上线DeepSeek大模型,实现了本地化部署和调用。
2月6日,南京智算中心携手国产芯片厂商寒武纪,宣布成功运用全国产设备运行国产大模型DeepSeek,为
苏宁易购提供全链条的国产化模型推理服务。
据悉,南京智算中心,由麒麟科创园于2020年投资建设,不仅是江苏唯一,也是国家首批“国家新一代人工智能公共算力开放创新平台”,更是长三角地区当前投运规模最大、算力最高的国产化智能计算中心。
DeepSeek发布后,南京智算中心迅速响应,与寒武纪、苏宁科技紧密合作,发挥各自优势,共同突破技术瓶颈,上线全国产算力版DeepSeek。
企业加速布局为基础赋能
DeepSeek大大提振了长三角AI技术人才的创业信心。
在DeepSeek模型受到广泛关注后,众多云计算厂商迎来了大量的用户咨询。一名云计算厂商相关人士对《国际金融报》记者透露,企业用户通常首先会在公有云平台上对DeepSeek进行测试,以评估其与自身需求的适配性。在确认适配后,这些用户会进一步考虑在私有云或一体机等形式上进行部署。
一家运营商云的销售人员指出,随着DeepSeek开源模型的适配完成并上线,云上的访问量和用量均出现了激增。
优刻得相关负责人表示,自DeepSeek开源模型上线以来,公司陆续收到了基于该模型的私有化部署需求,这些需求涵盖了一体机化、专有云化以及全面国产化等多种场景。
DeepSeek的崛起为长三角人工智能的发展带来了诸多机遇。
一位头部科技公司专家对《国际金融报》记者表示,在资源整合方面,DeepSeek通过整合算力与数据资源,为长三角企业的发展提供了有力支持。目前,该模型已正式登陆苏州、无锡、常州等地的算力平台,降低了企业的算力成本。例如,苏州本地企业用户可以享受高达20%的算力补贴,最高可达200万元。同时,无锡的“算力超市”也开放了DeepSeek的技术服务入口,为企业提供覆盖前后端、数据库、运维等全栈技术解决方案,助力无锡本土企业的创新与应用开发。
另外,该专家表示,DeepSeek的开源模式为长三角突破发展瓶颈提供了新路径。通过开源,DeepSeek降低了大模型的部署门槛与成本,使得应用场景的大规模崛起成为可能。“这一模式激发了长三角企业将DeepSeek的技术理念与市场需求相结合,加速推动了中国AI产业生态的演化。从网络安全到云计算,再到芯片领域,AI的跨界应用不仅优化了生产力,还提升了长三角在全球科技竞争中的潜力”。
算力短缺面临挑战
根据《上海市人工智能产业发展“十四五”规划》提出的目标,到2025年上海人工智能规上产业规模达到4000亿元。
上海市经信委方面表示,2024年上海人工智能产业规模突破4000亿元。上海提前宣告完成,给新一年长三角人工智能发展迎来“开门红”。
从大模型备案数量来看,长三角也已经驶入了“快车道”。据“网信上海”消息,截至2025年1月,长三角三省一市已有108款大模型在国家网信办完成备案,仅2024年11月和12月两个月就新增国家级备案26个。
不仅是上海,安徽正锚定打造人工智能产业创新高地。
记者了解到,安徽合肥高新区的“中国声谷”,只需语音指令,就可创作AIGC图片、应用程序等产品。目前,“中国声谷”入驻企业超过2000户,年产值超2000亿元,形成以智能语音及人工智能产业为核心的产业集群。
事实上,合肥高新区已聚集了一批通用人工智能领域的龙头企业,如
科大讯飞、
科大国创等,这些企业共同初步构建起了1+N+X的大模型及产品体系。在这一体系下,多家企业发布并投入使用了人工智能大模型和相关产品。
例如,2024年以来,
科大讯飞连续五次对讯飞星火的底座能力进行了升级,并首发了星火多语言大模型。
科大国创推出了“GC-GPT”大模型;数据空间研究院发布了“原子回声”大模型;羚羊工业互联网公司推出了“羚机一动”智能产品;中科类脑则发布了“玄视”电力视觉大模型。
不过,随着人工智能技术的飞速发展,越来越多大模型被应用于各行各业,这些大模型的训练和推理过程对算力的需求急剧增加,使得算力基础成为当前技术发展的一大关键问题。不少企业在推进大模型应用的过程中,正面临算力短缺的挑战。
以苏州创亿兴智能制造公司为例,该公司在生产线上利用大模型进行模拟和优化,以期提高生产效率和质量。但在实际操作中,大模型模拟一个完整的生产周期需要进行高达5000次的计算,对现有设备的算力是一个巨大的考验。据悉,目前该公司的设备仅能支持1000次左右的计算,远远无法满足大模型的需求。
“算力短缺不仅影响了大模型在生产线上的模拟和优化效果,还可能导致生产进度延误、成本增加等一系列问题。”一家算力科技有限公司技术工程师对《国际金融报》记者说,企业可以寻求算力提升的途径,包括升级现有设备、采购高性能计算设备等。
上述工程师直言,算力短缺也是当前许多企业在推进人工智能应用时普遍面临的问题。为了应对这一挑战,一些企业开始探索云计算、边缘计算等新型计算模式,以提高算力的灵活性和可扩展性。同时,也有企业开始关注量子计算等前沿技术,以期在未来能够突破算力瓶颈,推动人工智能技术的进一步发展。
(文章来源:国际金融报)