数据服务商直接受益于人工智能产业发展,人工标注短期仍不可替代。自动化标注技术在现阶段还存在一定的局限性,如对某些类型的数据的识 别准确率不高、对复杂场景的处理能力有限等。对于一些需要专业知识判断的标注任务,如医学影像标注、法律文本标注等,人工标注能做出更准确、合理的标注。大模型领域的发展对数据服务提供商主要的推动力包括:(1)预训练阶段,需要数据服务商提供大量的原始数据;(2)强化学习阶段,大模型的对齐需要数据服务商提供调优、反馈等服务;(3)应用阶段,企业需要针对自身业务特点和需求训练专用的小模型,需要数据服务商提供专业化、全流程数据服务。
随着AI 大模型训练的深化,数据服务商行业开始壁垒增长、附加值提高、集中度提高,行业头部企业将更受益于行业的发展。数据服务商在根据不同行业和企业要求进行改造,并提供需求数据的同时,还应该基于行业理解,与企业共同制定相关的标注规范和规则,从而让算法发挥出更高的识别效率。此外,还要深度参与到客户人工智能算法从预研立项、定制开发到部署投放的全过程中,凭借自身的数据服务能力,在不同阶段为客户提供自制数据集,定制化的数据采集、数据清洗和数据标注服务以及数据中台集成能力。我们认为,随着行业飞轮效应的逐步体现,数据服务商行业集中度将进一步提高,行业头部企业将更受益于行业的发展。
海天瑞声是AI 数据服务的国内头部企业。公司深耕数据服务行业20年,从做智能语音领域的数据服务起家,公司主要业务是AI 训练数据的研发设计、生产及销售业务。技术能力方面和场景资源方面,公司在基础研究、平台工具、训练数据生产方面均有技术积累,并公司持续在智能语音、计算机视觉、自然语言、以及智能驾驶为代表的垂直领域进行技术拓展;软实力方面,公司具有国资股东,拥有较强的项目管理能力和全流程的数据服务能力。这些优势有望使得公司在行业的竞争中进一步脱颖而出,进一步享受行业发展红利。
盈利预测:预计公司2025-2027 年营业收入分别为3.33/4.66/5.43 亿元,归母净利润分别为0.27/0.46/0.61亿元。公司所处赛道目前处于赛道正在大爆发早期阶段,应更关注公司收入及订单的增长而非利润,给予“买入”评级。
风险提示:地缘政治风险、海外业务拓展不及预期、市场竞争加剧、估值模型与盈利预测不及预期



