本报记者李昆昆李正豪北京报道
近日,国内头部大模型公司DeepSeek发文称,V3模型已完成小版本升级,目前版本号DeepSeek-V3-0324,用户登录官方网页、App、小程序进入对话界面后,关闭深度思考即可体验。API接口和使用方式保持不变。如非复杂推理任务,建议使用新版本V3模型,即刻享受速度更加流畅、效果全面提升的对话体验。
通常来说,大模型分为语言模型和推理模型。目前国内常见的语言模型有:DeepSeek V3 、阿里通义千问Qwen2.5、腾讯混元Turbo、百度文心4.5、智谱GLM4等;常见的推理模型有:DeepSeek R1、QwQ-32B、腾讯混元T1、百度文心X1、智谱GLM-Z1等。
人们普遍关心小版本升级的DeepSeek V3在同类产品中的表现。就此,爱分析首席分析师李喆接受《中国经营报》记者采访时表示:“推理模型是基于语言模型进行RL强化学习训练得到的,训练方法在DeepSeek R1论文公布后这已经是行业共识,因此,各家大模型厂商的重点还是竞争语言模型。”
易用性升级 DeepSeek方面称,新版V3模型借鉴DeepSeek-R1模型训练过程中所使用的强化学习技术,大幅提高了在推理类任务上的表现水平,在数学、代码类相关评测集上取得了超过GPT-4.5的得分成绩。此外,在代码、中文写作、中文搜索能力方面也得到了提升。
李喆认为,DeepSeek V3是混合专家(MOE)架构,Qwen2.5是密集架构;从企业应用角度来看,Qwen2.5密集架构参数量更小,私有部署的硬件资源要求更小,更适合企业用户部署落地。
具体来说,在数学与代码能力方面,DeepSeek V3在MATH数据集和HumanEval代码评测中表现突出,通过算法优化实现复杂问题分步推理。Qwen-32B依赖插件系统扩展能力,混元T1侧重应用层逻辑(如游戏脚本生成)。
多模态与长文本能力方面,Qwen-32B原生支持图像理解+10万token上下文窗口,DeepSeek V3需通过外部工具链扩展多模态,混元 T1文本生成优化和长上下文依赖剪辑技术,豆包专注短文本交互和实时性优先。
人工智能研究员Awni Hannun则表示,新的DeepSeek V3模型可以在配备M3 Ultra芯片的苹果电脑上,以每秒20个token的速度运行。这打破了业界关于人工智能模型能力与本地化运行或冲突的早前共识,也意味着数据中心并不是大模型的必要搭配。
另一名人工智能研究员Xeophon也透露,在内部工作台上测试了新版DeepSeek-V3后,发现它在测试的所有指标上都有了巨大飞跃。它现在是最好的非推理模型,超越了甲骨文的Claude Sonnet 3.5。
未来趋势 谈及未来行业发展趋势,盘古智库高级研究员江瀚告诉本报记者:“首先,技术融合与性能突破是核心
驱动力。DeepSeek V3-0324通过借鉴DeepSeek-R1的强化学习技术,在数学、代码等推理任务上超越GPT-4.5,证明技术融合对模型性能提升的显著作用。未来,大模型将进一步整合多模态学习、知识图谱、符号推理等技术,突破现有性能瓶颈。”
其次,应用场景的垂直化与专业化是必然趋势。DeepSeek V3在前端开发、中文写作、中文搜索等场景的优化上,体现了大模型向垂直领域深耕的路径。未来,医疗、金融、法律等垂直领域将涌现更多定制化大模型,满足行业对精准性、安全性和合规性的需求。
“最后,用户体验的全面提升是竞争关键。DeepSeek V3通过优化代码可用性、视觉设计、内容质量等细节,提升用户交互体验。未来,大模型将更加注重响应速度、交互自然度、个性化适配等维度。例如,通过模型压缩和边缘计算技术降低推理延迟,利用用户画像实现千人千面的服务,甚至通过情感计算技术理解用户情绪,提供更人性化的交互。”江瀚说。
李喆则认为,首先是语言模型和推理模型融合。从OpenAI公布的信息来看,后续GPT对外公布是个综合模型应用,包含语言模型和推理模型,以应用形式对外提供服务。其次是开源和闭源模型长期共存。从商业角度来看,全球第一梯队模型一定是闭源模型;第二梯队是1—2家开源模型,2—3家闭源模型;第三梯队是多家闭源模型。闭源模型商业模式从license转向freemium,收费依赖增值服务(部署运维、工具组件、垂直应用)。
总体上来说,李喆表示,未来大模型的发展可能将呈现多维度、跨领域的融合与突破。技术层面的演进包括规模与效率的平衡,表现在参数规模可能持续增长,但更注重训练效率(如稀疏模型、混合专家系统MoE)和能耗优化,避免盲目追求“大”;多模态深度融合,表现在从文本、图像、音频的整合扩展到视频、3D建模、传感器数据,甚至模拟物理世界(如
机器人控制);推理能力提升,表现在通过思维链(Chain-of-Thought)、递归推理架构或神经符号系统,解决复杂数学、逻辑问题;动态适应与持续学习,表现在突破静态训练模式,实现增量学习,减少灾难性遗忘,适应实时数据流。
同时,应用场景也会深化。垂直领域专业化表现在医疗(个性化诊疗)、法律(合同生成与漏洞检测)、教育(自适应学习系统)等领域出现行业专用模型;边缘计算普及表现在轻量化模型(如TinyML)部署到手机、IoT设备,支持离线实时交互(如实时翻译、AR导航);科学研究的辅助表现在加速药物发现、材料设计、气候模拟,甚至提出可验证的科学假设;创造性协作表现在成为艺术创作、音乐生成、游戏设计的核心工具,推动人机共创模式。
“未来大模型将走向更智能、更垂直、更人性化、更可持续,但其发展不仅是技术问题,更是社会协作的挑战。成功的关键在于平衡创新速度与伦理责任,构建技术、政策、公众认知协同进化的生态系统。”李喆说。
(文章来源:中国经营网)