查看研报:买入1、增持0、利润0.28亿、利润增143.82%
海天瑞声 核心题材:
AI语音(字节)+车路云+大数据
1、字节跳动一直以来是公司的重要客户,公司为其提供智能语音、计算机视觉以及自然语言等各类数据产品或服务。公司提供的训练数据覆盖智能语音、计算机视觉、自然语言等多个AI核心领域。
2、公司已经拥有超过205个语种/方言的覆盖能力,已积累下超过130个多语种的发音词典,累计词条数超过1,200万条,可支撑构建高质量的智能语音、以及多模态训练数据,是公司的主要竞争壁垒及核心技术之一。
3、2024年6月18日互动,公司具备行业领先的一体化数据处理平台,可高效服务于车路云中车端、路端的2D、3D、4D等全类数据处理需求。
4、公司已储备超过1300个自有知识产权的训练数据集产品,覆盖智能驾驶、机器人等场景。
5、公司已与北数所、上数所、深数所等3家交易所建立联系,并在北数所、上数所完成数据产品的挂牌上市,并成为北数所战略合作伙伴。
(更新时间:2024-12-11)
题材要点:
要点一:主要从事训练数据的研发和生产,涵盖智能语音、计算机视觉及自然语言处理三大AI核心领域
海天瑞声公司主要从事训练数据的研发和生产,涵盖智能语音、计算机视觉及自然语言处理三大AI核心领域。公司的核心产品是高质量、大规模、结构化的训练数据集,这些数据集广泛应用于算法模型的开发、训练和优化,支持AI技术的商业化落地。公司在智能语音领域提供语音识别和语音合成等技术服务,帮助机器将语音信号转换为文本信息。海天瑞声的训练数据集以专业数据集为基础,通过设计、采集和加工原料数据形成,成为算法模型训练的可靠素材。公司产品被广泛应用于个人助手、智能家居、智能驾驶等多种终端应用场景,是公司业务的重要组成部分。
要点二:智能语音数据服务
海天瑞声公司在智能语音领域提供语音识别和语音合成的训练数据服务。这些数据集包括音频文件、时间戳标注文件和发音词典等,支持客户在语音助手、语音导航等应用中的算法模型训练。
要点三:计算机视觉数据服务
公司在计算机视觉领域提供高质量的训练数据,支持图像识别、物体检测等应用。这些数据集为智能家居、智能驾驶等终端应用提供了坚实的基础,助力AI技术的商业化落地。
要点四:自然语言处理数据服务
海天瑞声提供涵盖自然语言处理的训练数据服务,支持内容生成、机器翻译等应用。公司的数据集为客户在多语种环境下的算法模型训练提供了可靠的素材,满足多样化需求。
要点五:大模型数据业务
公司通过大模型数据集产品及定制数据服务,覆盖从预训练到评测的全链条。大模型数据业务已成为公司新的增长引擎,服务范围涵盖主要大模型厂商和研究机构。报告期内,公司新增开发了多类多语种、多音色、多情感、多场景的ASR和TTS语音数据集,以及服务视觉理解以及视觉生成的视觉数据集。
要点六:智能驾驶行业数据服务业务
2024年,公司加大了对高级别数据标注工具的研发力度,DOTS-AD平台新增3D动静分离标注工具,BEV多图层4D车道线标注工具,并升级点云分割工具支持连续帧叠加标注和大点云分段加载、点云区域分割等核心能力。公司在全球范围内扩展了道路采集业务,可提供包括采集方案设计、采集人员组织、车队管理、车辆改装及数据清洗与脱敏等在内的全链条服务。
要点七:AI数据服务先锋
海天瑞声公司处于人工智能基础数据服务行业,专注于智能语音、计算机视觉及自然语言处理三大AI核心领域的数据服务。公司在行业内具有较高的技术门槛,产品和服务已被阿里巴巴、腾讯、百度等国内外知名客户认可,覆盖了科技互联网、智能驾驶、智慧金融等多个领域。公司通过自主研发积累了12项核心技术,能够提供高质量的训练数据集,支持AI算法模型的开发和优化。公司在全球市场上拥有超过1,000家客户,境外客户数量已超过250家,展现了其在行业中的重要地位和影响力。