当虹科技：多模态下机器人遥操需求提升，受益操成为所有机器人标配功能

来源：九方智投 2025-08-07 13:19

公司是机器人远程控制的视频压缩技术提供者。机器人遥操（Remote Operation）是指通过远程操控设备，对机器人进行实时或近实时的控制，使其完成特定任务。其核心功能包括数据采集与远程执行两大方面。早期遥操技术主要应用于远程手术机器人等高精度场景，典型代表如达芬奇手术机器人。这类系统通过医生操作控制台，将动作映射至机械臂，实现精准操作。

早期遥操系统存在明显局限：不具备学习能力，操作数据通常不保存，动作执行为“一次性复制”，缺乏数据沉淀与模型优化能力。

现代遥操技术的升级路径：当前遥操技术已进入新阶段，核心特征是数据可留存、可训练、可泛化。现代遥操系统在执行过程中，会全面采集机器人关节、电机、力矩、视觉等多维数据，并结合AI算法进行预训练，最终形成具备泛化能力的控制模型。

这一转变使得遥操不仅是“远程控制”，更成为机器人训练数据的重要来源。尤其是在人形机器人尚未具备完全自主智能的当下，遥操成为实现复杂任务执行的关键手段。

遥操的主要应用场景：

1）高危环境作业：在核电、钢铁、化工等高温、高湿、有毒有害环境中，人类作业风险极高。遥操机器人可通过第一视角摄像头将现场画面回传，操作员在安全环境中完成任务。例如电力系统中的开关柜操作、刀闸控制等，已开始试点遥操应用。

2）科研与实验场景：高校及科研机构广泛使用遥操进行机器人算法验证、实验测试等，是技术迭代的重要支撑。

3）未来人形机器人接管机制：即使机器人具备一定自主能力，仍需保留“遥操接管”功能，以应对突发情况或黑客攻击。专家指出，未来的“遥操”可能并非由人类直接操作，而是由高稳定性后台系统基于规则控制（Rule-based Control）进行接管，形成“AI主控+规则兜底”的混合模式。

遥操的应用比例与瓶颈

目前，具备遥操能力的机器人占比极低，主要集中在科研项目和特定工业场景。主要原因如下：

1、效率与成本问题：遥操系统成本高，操作延迟大，效率远低于人类现场作业。

2、技术成熟度不足：机器人“大脑”尚未成熟，难以实现端到端自主，导致遥操成为“不得已”的选择。

3、用户体验差异：遥操依赖视频回传与虚拟操作界面，与真实环境存在感知偏差，影响操作精度。

专家比喻：“自己开车”与“在虚拟驾驶舱开车”体验完全不同，遥操的沉浸感与实时性仍待提升。

遥操技术的核心难点

1、实时性要求高：操作与执行之间延迟需控制在毫秒级，否则可能导致任务失败或安全事故。

2、人机关节映射难题：人体关节与机器人电机关节在结构、力度、加速度等方面存在差异，如何实现精准映射是关键技术挑战。

3、视频传输与压缩压力大：遥操依赖第一视角视频流回传，对网络带宽、延迟、压缩效率要求极高。

视频压缩技术的重要性与产业格局

随着多模态大模型在机器人中的应用，视频数据量激增，高效视频编码技术成为遥操落地的关键。专家指出，当红科技正在研发专为人形机器人优化的视频压缩算法，具备较高技术价值。

目前主流仍采用H.264/H.265等通用编码标准，部分厂商（如海康、大华、宇视）在其基础上进行二次压缩优化（如宇视“优控”技术）。当红科技的差异化在于聚焦机器人场景，提供定制化压缩方案。

此前，部分厂商曾采用思翼科技的遥操终端方案，整套系统成本约小几千元。若当红科技能提供更优压缩效率且价格更具竞争力，具备替代潜力。

产业链模式：外采为主，整机厂不自研。机器人整机厂商普遍不自研视频压缩技术，原因在于：技术非核心主航道；自研投入大，复用性低；缺乏前后端协同（如IPC+MVR+存储）的生态闭环。行业普遍采用外采第三方方案，形成“终端+算法+网络”协同的供应链模式。

定制化需求与价格分层：部分行业机器人（如安保、巡检）因环境复杂、精度要求高，需进行深度定制，涉及特殊编码、抗干扰、低延迟等需求，价格显著高于通用方案，可达数万元级别。

消费级机器人对遥操需求较低，通用编码方案（如萤石等家用监控技术）已能满足基本需求。由于成本敏感，专门定制压缩算法不具经济性。

多模模态大模型带来的新挑战：多模态大模型在机器人中的应用将大幅提升对数据流、算力、带宽的要求。即便实现端侧智能，视频数据仍需回传至云端进行训练与优化，遥操系统的数据采集功能不可替代。

目前端到端全自主仍难以实现，机器人仍需依赖云端协同，遥操在训练与应急场景中将持续发挥关键作用。未来人形机器人普及后，遥操比例会有所提升，但受限于虚拟操作的体验差异，仍主要用于高危或人类不便进入的场景。遥操成为所有机器人的标配功能：尤其是作为AI失控时的“安全兜底”机制，即使非人类直接操作，也应具备系统级接管能力。除当虹科技外，目前主要为思翼科技，另有部分无人机厂商（如大疆）尝试将其遥感技术适配机器人，但未做深度定制。视频压缩技术是因非核心能力，且缺乏生态协同，外采更具性价比。

多模态模型提高遥操需求：相反，更高阶的AI需要更多高质量数据，遥操作为数据采集手段，需求将上升。

预研成果步入落地期，业绩拐点将至。公司前期重要在研项目进展顺利，车载视频处理技术、面向元宇宙的基于NeRF的体积视频压缩编码技术、基于大模型的视频AIGC生成技术等已进入产品测试阶段，落地变现加速。大模型赋能对内降本增效，严控项目质量，新业务占比提升，广电业务企稳，现金流情况逐步好转，2024年利润已减亏。

公司在AI方面有多年的布局，公司主要基于BlackEye大模型进行各行业端侧大模型训练和落地，我们也认为未来端侧模型是行业趋势，需求更加明确。同时，公司在AI大模型方向上持续跟进最前沿技术，也会一直围绕基于AI、大模型技术对公司各大业务方向产品做创新升级。公司覆盖的行业特别多、业务场景也特别多，有AI+传媒场景、AI+工业场景、AI+卫星场景、AI+智舱/智驾场景等，可应用的范围很广。针对智能物联、智能家居、工业巡检、无人设备、远程车控、多模态交互等场景，公司有自研的AIRTC实时音视频云平台，提供一体化端到端解决方案，构建视频产品创新应用基座。该平台基于公司音视频技术，在“超级压缩、超低时延、全场景适配”三大核心能力上持续突破，让各类设备在多种网络环境下都能实现清晰、稳定、高效的实时音视频交互。

公司的核心技术包括视频超低延时编码、视频超级压缩、视觉AI大模型及BlackEye多模态视听大模型等，可以广泛应用于众多工业与消费级业务领域，实现超高压缩率编码与超低延时视频传输，确保各种复杂场景低带宽下视频回传与远程控制。公司十分重视我们的技术在具身智能领域的落地，比如通过视频处理、AI模型与多模态技术的融合，能为机器人提供从感知、传输到决策的全链条支持，实现真正的远程操控，能应用的场景多样，目前与一些具身智能主机厂在共同推进中。

拥有编解码及音视频处理核心技术，由传媒向工业及智驾拓展。高清视频编解码技术为护城河，参与标准制定。公司专注于下一代超高清视频编转码、内容感知编码和自适应视频处理、面向人机混合视觉的超级编码、面向元宇宙的体积视频编码、AIGC多模态内容生成、视频超级压缩技术等核心算法和技术。核心技术自主研发，为公司拓展三大业务领域提供支撑。

技术领先性体现在：

1）新一代超高清视频编码标准AVS3，是全球首个面向8K超高清及5G产业应用的音视频信源编码标准；

2）HDRVivid和AudioVivid解决我国超高清音视频行业HDR、三维声标准从无到有的问题。

3）首批“百城千屏”超高清视音频传播系统技术标准，为打造户外超高清观赛矩阵提供技术支撑。

三维声、HDR、全国产化方案兼容适配能力领先，更好适配异构计算架构。当虹科技已支持AudioVivid、中国全景声、Fraunhofer3D音频、DolbyAtmos，完成三维声动态元数据全链路的支持。同时，支持HDR10/HLG/SDR/SL-HDR以及DolbyVision和HDRVivid标准，并实现各HDR格式之间的互转。2024年，公司已重点推动国产服务器、国产CPU、国产操作系统、国产数据库的适配和优化工作，并获得了相应的兼容性证书。

与摩尔线程达成深度合作，多款DeepSeek一体机发布。2025年3月，当虹科技基于国产全功能GPU成功完成了BlackEye多模态视听大模型深度融合，且双方合作的算力设备已经在超高清GPU算力场景中成功落地，在视听内容生产、图形渲染、视频编解码等方面合作前景广泛。2025年2月，当虹龙智正式发布“DeepSeek+虹小智”政务AI多模态大模型算力一体机。“DeepSeek+虹小智”大模型算力一体机适配了华为鲲鹏和昇腾全国产化算力平台，具备“多模态思维”，可以广泛应用于一网通办、智能台账、智能填报、智能巡检、辅助决策等多种场景。基于“DeepSeek+虹小智”政务AI大模型的双模引擎创新，公司开发了社区基层减负平台和国有资产动态管理系统，实现社区行政负担明显降低与国有资产盘活率显著提升。2025年2月，当虹科技发布“DeepSeek+BlackEye”多模态大模型一体机，为传媒行业发展注入新活力，客户主要为电视台、互联网视频、运营商及新媒体机构。DeepSeek的“大脑级”推理+BlackEye的“感官级”感知及创作，构建从认知到生成的智能链路闭环。

公司AIGC多模态模型相较于通用模型优势主要体现在：

1）训练数据质量更高：通过图像画质检测技术清洗画质过于低劣的图片或者视频，提升画质，从而提升训练效果。

2）提升基座模型准确性：基于眼球追踪的人类注意力预测模型进行图像视频增强，完成模型的高准确性。

3）在局部瑕疵修复及视频图像增强技术具有领先优势。

模型开源有利于生态搭建，激发产业链厂商对AI技术应用落地的探索热情，也为开源模型厂商及团体赢得更高的产业关注度及话语权。2025年以来，Deepseek、阿里巴巴等厂商模型相继选择开源，有利于当虹科技等厂商部署及进一步开发，公司产品能力的提升预计加速。当虹科技自主研发的多模态视听大模型BlackEye，已经深度融合DeepSeek-R1和DeepSeekJanus-Pro，能够对文本、图像、音频、视频乃至三维模型等多种模态信息进行深度理解，并实现多模态内容的推理与生成。

基于以上自研的核心技术及优势，当虹科技提供“传媒文化”、“工业与卫星”和“智能座舱”的完整音视频及娱乐解决方案。1）车载智能座舱：基于视频压缩、超低延迟编码、视频娱乐等核心能力，落地智能座舱解决方案，已覆盖多家车企。2）工业与卫星：视频超级压缩产品快速拓展，涵盖能源、电网电力、轨交等行业，还有基于卫星互联网的超窄带场景、远洋船舶等。3）传媒文化：涉及IPTV新媒体、广播电视、互联网视频，公司加深了与运营商的合作，将AI能力融合进赛事直播、转播等各个场景。

1）智能座舱：座舱娱乐赛道优势独特，多途径提升单车价值量。2024年，车载智能座舱产品收入占比提升至15%。公司优势产品包括屏帧级协同播放、5D沉浸式智能座舱、哨兵守护等。同时，公司深度合作车载内容端，收入模式有望迎来新变化。当虹科技与浙江广电集团、央视频平台、爱奇艺等在车载娱乐端已建立深入合作，车端高清内容资源不断丰富积累，未来有望探索开拓车主订阅抽成，广告运营等新收入模式。

2）工业与卫星：视频编解码技术在工业物联网应用空间广，业务增长弹性大。AI视频多数据源接入与实时处理需求最能反映编解码技术的重要性。公司为国内极少数同时具备“视频超低延时编码及超级压缩”与“智能AI识别”技术的厂商，在智慧交通、远洋船舶、无人机、矿山、能源及电网领域已有客户落地。公司技术优势体现在，编解码技术节省了中心端90%的存储空间，70%的机架空间和能源消耗，满足行业客户智能化、无人化需求，以及支持集团内部和行业监管部门远程实时视频调阅。通过集成DeepSeek等领先模型，当虹科技BlackEye多模态理解能力明显提升，产品落地预计加速。

3）传媒文化：受益高清频道内容增加，AI赋能业务领域拓展。当前公司主要收入来源，2024年收入占比约61%。当虹科技市场基础扎实，与客户绑定紧密，覆盖中国网络电视台等七大互联网视频牌照商、广电总局、中央广播电视总台、省级广播电视客户及三大电信运营商。公司深度参与超高清行业标准制定，支持“百城千屏”项目落地，保障北京冬奥会、卡塔尔世界杯、杭州亚运会等重要赛事印证技术实力。当虹科技助力中国移动咪咕公司，将HDRVivid标准应用到了咪咕视频赛事直播多条线路当中。

参考资料：

20250605-方正证券-当虹科技：预研技术落地期，智能座舱、工业及卫星驱动新增长

本报告仅提供给九方金融研究所的特定客户及其他专业人士，用于市场研究、讨论和交流之目的。

未经九方金融研究所事先书面同意，不得更改或以任何方式传送、复印或派发本报告的材料、内容及其复印本予以任何第三方。如需引用、或经同意刊发，需注明出处为九方金融研究所，且不得对本报告进行有悖于原意的引用、删节和修改。

本报告由研究助理协助资料整理，由投资顾问撰写。本报告的信息均来源于市场公开消息和数据整理，本公司对报告内容（含公开信息）的准确性、完整性、及时性、有效性和适用性等不做任何陈述和保证。本公司已力求报告内容客观、公正，但报告中的观点、结论和建议仅反映撰写者在报告发出当日的设想、见解和分析方法应仅供参考。同时，本公司可发布其他与本报告所载资料不一致及结论有所不同的报告。本报告中的信息或意见不构成交易品种的买卖指令或买卖出价，投资者应自主进行投资决策，据此做出的任何投资决策与本公司或作者无关，自行承担风险，本公司和作者不因此承担任何法律责任。

投资顾问：王德慧（登记编号：A0740621120003）

(来源：

九方智投)

免责声明：以上内容仅供参考学习使用，不作为投资建议，此操作风险自担。投资有风险、入市需谨慎。

写评论