行情中心 沪深京A股 上证指数 板块行情 股市异动 股圈 专题 涨跌情报站 盯盘 港股 研究所 直播 股票开户 智能选股
全球指数
数据中心 资金流向 龙虎榜 融资融券 沪深港通 比价数据 研报数据 公告掘金 新股申购 大宗交易 业绩速递 科技龙头指数

海天瑞声:北京海天瑞声科技股份有限公司投资者关系活动记录表-2023年12月11日

公告原文类别 2023-12-11 查看全文

证券代码:688787 证券简称:海天瑞声

北京海天瑞声科技股份有限公司

投资者关系活动记录表

编号:2023-021

投资者关系活动类别 √特定对象调研 □分析师会议 □媒体采访 □业绩说明会 □新闻发布会 □路演活动 □现场参观 □电话会议 □其他 (请文字说明其他活动内容)

参与单位名称及人员姓名 开源证券 刘逍遥

会议时间 2023年12月7日

会议地点 海天瑞声会议室

上市公司接待人员姓名 证券事务代表:张哲 投资者关系负责人:袁璐

投资者关系活动主要内容介绍 1、大模型范式下的预训练阶段数据需求和传统的数据需求有什么区别? 大模型预训练阶段的数据需求和深度学习技术路线下的传统训练数据需求,两者在形态上基本一致,都是文本、语音和图像,但在数据规模、质量、来源等方面,预训练数据较传统训练数据会存在一定差异。例如,规模上,预训练数据的token量普遍在万亿量级,而传统模型数量则大约在10亿量级。从数据来源的角度看,由于大模型所需数据规模远超传统模型,因此其数据来源将更加丰富以满足规模化、多元化数据需求。具体来说,大模型数据来源除了来自传统的定向采集外,还将涉及版权数据、公共数据等新型海量高质量数据来源。 此外,数据处理的核心技术也存在一定差异。例如,由于大模型预训练阶段的原料数据规模更大,因此大模型预训练数据更加注重数据清洗的工程化能力,在预训练阶段需要结合原料数据特点以及所涉及的主题、领域等,对海量数据完成高质量清洗,这对数据服务商的工程化数据处理能力以及过往服务经验的积累都提出了更高要求。 2、大模型预训练阶段很大程度用的都是无监督学习,无监督学习下,公司的业务是否会受影响,或者会产生哪些新的数据机遇? 大模型是人工智能技术新的发展范式,该技术路线下将衍生出新型数据需求。例如,预训练阶段,数据服务公司需能根据客户的大模型需求,完成对海量数据清洗方案的设计以及执行,通过清洗出高质量数据,帮助客户高效完成模型预训练开发;同时,预训练想要达到更高阶的通用学习效果,需要更为丰富的高质量数据来源,例如各类版权数据等,因此,能聚集更为丰富的版权类数据、并以工程化和规模化地方式向客户提供相应服务的数据服务商将具有更高的市场竞争力。 此外,为使大模型能力更趋近于人类,大模型还将在完成预训练的基础上,通过有监督微调以及基于人类反馈的强化学习,实现模型在特定方向上的优化迭代。上述两个阶段均需深度人工参与,同时参与上述两阶段的数据处理人员将被要求有更高的认知水平和专业能力,以更好指导机器完成高阶能力优化。 大模型时代实质上是一个海量数据的时代,随之将产生海量的数据需求,数据服务模式也将由传统的数据标注向获得海量高质量数据、以及更强的数据处理能力转变,这对数据服务商提出了新的、更高的要求。因此,能够前瞻性布局大模型数据服务能力的服务商将优先获得市场机会,建立先行的护城河。 3、请问大模型向多模态发展后,是否会对公司业务产生正向影响? 大模型向多模态发展后,将会产生更多的新型数据需求。例如文生图的多模态大模型,通过文字输入生成对应图片,这就需要机器理解文字语义的同时将理解的关键词与图片的关键标签进行映射,通过对齐两种独立模态关键特征的方式,实现按指令的创作,以此完成学习训练过程。因此,当大模型向多模态能力维度拓展时,高质量多模态训练数据集的持续学习训练的重要性将更加凸显,多模态的发展将推动数据服务行业进入更大的增量空间。 4、公司定增项目中的数据生产垂直大模型主要是做什么的?是否是单纯针对数据生产而推出的大模型? 公司全栈自研的数据生产垂直大模型,将可辅助完成面向多个下游任务的数据设计与处理规则,形成包括数据清洗方案设计、指令方案设计、指令泛化与迁移、指令数据验证、多模态数据方案等在内的多项生成能力,以及在上述方案下的原始数据及标注成果生成能力。本项目的研发将服务数据生产垂直方向,应对未来数据智能进一步发展的方向。 5、海天瑞声以什么身份和大数据交易所进行合作? 目前海天瑞声在大数据交易所的主要角色是数商,即数据交易标的的供应方,通过在交易所挂牌自有知识产权的数据产品完成数据交易。 6、目前公司是否有数据集挂到数据交易所进行交易?目前数据交易所方面具体有什么进展? 目前海天瑞声已与北数所、上数所、深数所等3家交易所建立联系,并在北数所、上数所完成数据产品的挂牌上市,并成为北数所战略合作伙伴。未来,公司将继续拓展、加强与各地数交所的合作,积极加入数据要素生态圈,助力国家数字经济和数据要素市场快速发展。 7、智能驾驶行业的核心竞争力是什么? 智能驾驶数据领域的核心竞争力主要体现在三个方面,分别是平台能力、算法能力以及数据安全能力。 平台能力是数据标注能力的基石。平台功能点覆盖的丰富度是评价平台水平的核心要素,目前同时具备2D标注、3D点云标注、2D-3D联合标注以及3D语义分割标注的供应商比较有限,能以最快速度覆盖更多功能需求的数据服务商将能更好掌握智能驾驶数据市场的主动权以及议价能力。 第二个核心要素是算法能力。平台的智能化程度越高,对人的依赖程度越低,在提高平台的生产效率的同时可以大幅降低生产成本。 第三个要素是数据安全能力。智能驾驶数据不同于传统的语音类数据,由于其采集图像涉及大量的地理及个人隐私信息,为更好防范数据安全风险,国家相关法律法规要求数据流转链条上各类企业必须做好充分的数据安全保障。因此,未来不具备相关数据安全能力的供应商将逐渐被市场淘汰。 8、公司智能驾驶客户有哪些? 受益于智能驾驶业务蓬勃发展以及公司在该领域的强力布局,截至2023年6月底,公司已服务超过70家智能驾驶领域客户,覆盖传统车企、新势力车企、智能驾驶技术公司等。目前公司也在该领域进行持续的客户拓展,进一步加固客户储备,迎接行业爆发。

附件清单(如有)

日期 2023年12月11日

免责声明

以上内容仅供您参考和学习使用,任何投资建议均不作为您的投资依据;您需自主做出决策,自行承担风险和损失。九方智投提醒您,市场有风险,投资需谨慎。

推荐阅读

相关股票

相关板块

  • 板块名称
  • 最新价
  • 涨跌幅

相关资讯

扫码下载

九方智投app

扫码关注

九方智投公众号

头条热搜

涨幅排行榜

  • 上证A股
  • 深证A股
  • 科创板
  • 排名
  • 股票名称
  • 最新价
  • 涨跌幅
  • 股圈