当虹科技:多模态下机器人遥操需求提升,受益操成为所有机器人标配功能
公司是机器人远程控制的视频压缩技术提供者。机器人遥操(Remote Operation)是指通过远程操控设备,对机器人进行实时或近实时的控制,使其完成特定任务。其核心功能包括 数据采集 与 远程执行 两大方面。早期遥操技术主要应用于 远程手术机器人 等高精度场景,典型代表如达芬奇手术机器人。这类系统通过医生操作控制台,将动作映射至机械臂,实现精准操作。
早期遥操系统存在明显局限:不具备学习能力 ,操作数据通常不保存,动作执行为“一次性复制”,缺乏数据沉淀与模型优化能力。
现代遥操技术的升级路径:当前遥操技术已进入新阶段,核心特征是 数据可留存、可训练、可泛化 。现代遥操系统在执行过程中,会全面采集机器人关节、电机、力矩、视觉等多维数据,并结合AI算法进行预训练,最终形成具备泛化能力的控制模型。
这一转变使得遥操不仅是“远程控制”,更成为 机器人训练数据的重要来源 。尤其是在人形机器人尚未具备完全自主智能的当下,遥操成为实现复杂任务执行的关键手段。
遥操的主要应用场景:
1)高危环境作业:在核电、钢铁、化工等高温、高湿、有毒有害环境中,人类作业风险极高。遥操机器人可通过第一视角摄像头将现场画面回传,操作员在安全环境中完成任务。例如电力系统中的开关柜操作、刀闸控制等,已开始试点遥操应用。
2)科研与实验场景:高校及科研机构广泛使用遥操进行机器人算法验证、实验测试等,是技术迭代的重要支撑。
3)未来人形机器人接管机制:即使机器人具备一定自主能力,仍需保留“遥操接管”功能,以应对突发情况或黑客攻击。专家指出,未来的“遥操”可能并非由人类直接操作,而是由 高稳定性后台系统 基于规则控制(Rule-based Control)进行接管,形成“AI主控+规则兜底”的混合模式。
遥操的应用比例与瓶颈
目前,具备遥操能力的机器人占比 极低 ,主要集中在科研项目和特定工业场景。主要原因如下:
1、 效率与成本问题 :遥操系统成本高,操作延迟大,效率远低于人类现场作业。
2、 技术成熟度不足 :机器人“大脑”尚未成熟,难以实现端到端自主,导致遥操成为“不得已”的选择。
3、 用户体验差异 :遥操依赖视频回传与虚拟操作界面,与真实环境存在感知偏差,影响操作精度。
专家比喻:“自己开车”与“在虚拟驾驶舱开车”体验完全不同,遥操的沉浸感与实时性仍待提升。
遥操技术的核心难点
1、 实时性要求高 :操作与执行之间延迟需控制在毫秒级,否则可能导致任务失败或安全事故。
2、 人机关节映射难题 :人体关节与机器人电机关节在结构、力度、加速度等方面存在差异,如何实现精准映射是关键技术挑战。
3、 视频传输与压缩压力大 :遥操依赖第一视角视频流回传,对网络带宽、延迟、压缩效率要求极高。
视频压缩技术的重要性与产业格局
随着多模态大模型在机器人中的应用,视频数据量激增, 高效视频编码技术 成为遥操落地的关键。专家指出, 当红科技 正在研发专为人形机器人优化的视频压缩算法,具备较高技术价值。
目前主流仍采用H.264/H.265等通用编码标准,部分厂商(如海康、大华、宇视)在其基础上进行二次压缩优化(如宇视“优控”技术)。当红科技的差异化在于 聚焦机器人场景 ,提供定制化压缩方案。
此前,部分厂商曾采用 思翼科技的遥操终端方案,整套系统成本约小几千元。若当红科技能提供更优压缩效率且价格更具竞争力,具备替代潜力。
产业链模式:外采为主,整机厂不自研。机器人整机厂商普遍不自研视频压缩技术,原因在于:技术非核心主航道;自研投入大,复用性低;缺乏前后端协同(如IPC+MVR+存储)的生态闭环。行业普遍采用外采第三方方案,形成“终端+算法+网络”协同的供应链模式。
定制化需求与价格分层:部分行业机器人(如安保、巡检)因环境复杂、精度要求高,需进行深度定制,涉及特殊编码、抗干扰、低延迟等需求,价格显著高于通用方案,可达数万元级别。
消费级机器人对遥操需求较低,通用编码方案(如萤石等家用监控技术)已能满足基本需求。由于成本敏感,专门定制压缩算法不具经济性。
多模模态大模型带来的新挑战:多模态大模型在机器人中的应用将大幅提升对数据流、算力、带宽的要求。即便实现端侧智能,视频数据仍需回传至云端进行训练与优化,遥操系统的数据采集功能不可替代。
目前端到端全自主仍难以实现,机器人仍需依赖云端协同,遥操在训练与应急场景中将持续发挥关键作用。未来人形机器人普及后,遥操比例会有所提升,但受限于虚拟操作的体验差异,仍主要用于高危或人类不便进入的场景。遥操成为所有机器人的标配功能:尤其是作为AI失控时的“安全兜底”机制,即使非人类直接操作,也应具备系统级接管能力。除当虹科技外,目前主要为思翼科技,另有部分无人机厂商(如大疆)尝试将其遥感技术适配机器人,但未做深度定制。视频压缩技术是因非核心能力,且缺乏生态协同,外采更具性价比。
多模态模型提高遥操需求:相反,更高阶的AI需要更多高质量数据,遥操作为数据采集手段,需求将上升。
预研成果步入落地期,业绩拐点将至。公司前期重要在研项目进展顺利,车载视频处理技术、面向元宇宙的基于NeRF的体积视频压缩编码技术、基于大模型的视频AIGC生成技术等已进入产品测试阶段,落地变现加速。大模型赋能对内降本增效,严控项目质量,新业务占比提升,广电业务企稳,现金流情况逐步好转,2024年利润已减亏。
公司在AI方面有多年的布局,公司主要基于BlackEye大模型进行各行业端侧大模型训练和落地,我们也认为未来端侧模型是行业趋势,需求更加明确。同时,公司在AI大模型方向上持续跟进最前沿技术,也会一直围绕基于AI、大模型技术对公司各大业务方向产品做创新升级。公司覆盖的行业特别多、业务场景也特别多,有AI+传媒场景、AI+工业场景、AI+卫星场景、AI+智舱/智驾场景等,可应用的范围很广。针对智能物联、智能家居、工业巡检、无人设备、远程车控、多模态交互等场景,公司有自研的AIRTC实时音视频云平台,提供一体化端到端解决方案,构建视频产品创新应用基座。该平台基于公司音视频技术,在“超级压缩、超低时延、全场景适配”三大核心能力上持续突破,让各类设备在多种网络环境下都能实现清晰、稳定、高效的实时音视频交互。
公司的核心技术包括视频超低延时编码、视频超级压缩、视觉AI大模型及BlackEye多模态视听大模型等,可以广泛应用于众多工业与消费级业务领域,实现超高压缩率编码与超低延时视频传输,确保各种复杂场景低带宽下视频回传与远程控制。公司十分重视我们的技术在具身智能领域的落地,比如通过视频处理、AI模型与多模态技术的融合,能为机器人提供从感知、传输到决策的全链条支持,实现真正的远程操控,能应用的场景多样,目前与一些具身智能主机厂在共同推进中。
拥有编解码及音视频处理核心技术,由传媒向工业及智驾拓展。高清视频编解码技术为护城河,参与标准制定。公司专注于下一代超高清视频编转码、内容感知编码和自适应视频处理、面向人机混合视觉的超级编码、面向元宇宙的体积视频编码、AIGC多模态内容生成、视频超级压缩技术等核心算法和技术。核心技术自主研发,为公司拓展三大业务领域提供支撑。
技术领先性体现在:
1)新一代超高清视频编码标准AVS3,是全球首个面向8K超高清及5G产业应用的音视频信源编码标准;
2)HDRVivid和AudioVivid解决我国超高清音视频行业HDR、三维声标准从无到有的问题。
3)首批“百城千屏”超高清视音频传播系统技术标准,为打造户外超高清观赛矩阵提供技术支撑。

三维声、HDR、全国产化方案兼容适配能力领先,更好适配异构计算架构。当虹科技已支持AudioVivid、中国全景声、Fraunhofer3D音频、DolbyAtmos,完成三维声动态元数据全链路的支持。同时,支持HDR10/HLG/SDR/SL-HDR以及DolbyVision和HDRVivid标准,并实现各HDR格式之间的互转。2024年,公司已重点推动国产服务器、国产CPU、国产操作系统、国产数据库的适配和优化工作,并获得了相应的兼容性证书。
与摩尔线程达成深度合作,多款DeepSeek一体机发布。2025年3月,当虹科技基于国产全功能GPU成功完成了BlackEye多模态视听大模型深度融合,且双方合作的算力设备已经在超高清GPU算力场景中成功落地,在视听内容生产、图形渲染、视频编解码等方面合作前景广泛。2025年2月,当虹龙智正式发布“DeepSeek+虹小智”政务AI多模态大模型算力一体机。“DeepSeek+虹小智”大模型算力一体机适配了华为鲲鹏和昇腾全国产化算力平台,具备“多模态思维”,可以广泛应用于一网通办、智能台账、智能填报、智能巡检、辅助决策等多种场景。基于“DeepSeek+虹小智”政务AI大模型的双模引擎创新,公司开发了社区基层减负平台和国有资产动态管理系统,实现社区行政负担明显降低与国有资产盘活率显著提升。2025年2月,当虹科技发布“DeepSeek+BlackEye”多模态大模型一体机,为传媒行业发展注入新活力,客户主要为电视台、互联网视频、运营商及新媒体机构。DeepSeek的“大脑级”推理+BlackEye的“感官级”感知及创作,构建从认知到生成的智能链路闭环。

公司AIGC多模态模型相较于通用模型优势主要体现在:
1)训练数据质量更高:通过图像画质检测技术清洗画质过于低劣的图片或者视频,提升画质,从而提升训练效果。
2)提升基座模型准确性:基于眼球追踪的人类注意力预测模型进行图像视频增强,完成模型的高准确性。
3)在局部瑕疵修复及视频图像增强技术具有领先优势。
模型开源有利于生态搭建,激发产业链厂商对AI技术应用落地的探索热情,也为开源模型厂商及团体赢得更高的产业关注度及话语权。2025年以来,Deepseek、阿里巴巴等厂商模型相继选择开源,有利于当虹科技等厂商部署及进一步开发,公司产品能力的提升预计加速。当虹科技自主研发的多模态视听大模型BlackEye,已经深度融合DeepSeek-R1和DeepSeekJanus-Pro,能够对文本、图像、音频、视频乃至三维模型等多种模态信息进行深度理解,并实现多模态内容的推理与生成。

基于以上自研的核心技术及优势,当虹科技提供“传媒文化”、“工业与卫星”和“智能座舱”的完整音视频及娱乐解决方案。1)车载智能座舱:基于视频压缩、超低延迟编码、视频娱乐等核心能力,落地智能座舱解决方案,已覆盖多家车企。2)工业与卫星:视频超级压缩产品快速拓展,涵盖能源、电网电力、轨交等行业,还有基于卫星互联网的超窄带场景、远洋船舶等。3)传媒文化:涉及IPTV新媒体、广播电视、互联网视频,公司加深了与运营商的合作,将AI能力融合进赛事直播、转播等各个场景。



1)智能座舱:座舱娱乐赛道优势独特,多途径提升单车价值量。2024年,车载智能座舱产品收入占比提升至15%。公司优势产品包括屏帧级协同播放、5D沉浸式智能座舱、哨兵守护等。同时,公司深度合作车载内容端,收入模式有望迎来新变化。当虹科技与浙江广电集团、央视频平台、爱奇艺等在车载娱乐端已建立深入合作,车端高清内容资源不断丰富积累,未来有望探索开拓车主订阅抽成,广告运营等新收入模式。
2)工业与卫星:视频编解码技术在工业物联网应用空间广,业务增长弹性大。AI视频多数据源接入与实时处理需求最能反映编解码技术的重要性。公司为国内极少数同时具备“视频超低延时编码及超级压缩”与“智能AI识别”技术的厂商,在智慧交通、远洋船舶、无人机、矿山、能源及电网领域已有客户落地。公司技术优势体现在,编解码技术节省了中心端90%的存储空间,70%的机架空间和能源消耗,满足行业客户智能化、无人化需求,以及支持集团内部和行业监管部门远程实时视频调阅。通过集成DeepSeek等领先模型,当虹科技BlackEye多模态理解能力明显提升,产品落地预计加速。
3)传媒文化:受益高清频道内容增加,AI赋能业务领域拓展。当前公司主要收入来源,2024年收入占比约61%。当虹科技市场基础扎实,与客户绑定紧密,覆盖中国网络电视台等七大互联网视频牌照商、广电总局、中央广播电视总台、省级广播电视客户及三大电信运营商。公司深度参与超高清行业标准制定,支持“百城千屏”项目落地,保障北京冬奥会、卡塔尔世界杯、杭州亚运会等重要赛事印证技术实力。当虹科技助力中国移动咪咕公司,将HDRVivid标准应用到了咪咕视频赛事直播多条线路当中。
参考资料:
20250605-方正证券-当虹科技:预研技术落地期,智能座舱、工业及卫星驱动新增长
本报告仅提供给九方金融研究所的特定客户及其他专业人士,用于市场研究、讨论和交流之目的。 未经九方金融研究所事先书面同意,不得更改或以任何方式传送、复印或派发本报告的材料、内容及其复印本予以任何第三方。如需引用、或经同意刊发,需注明出处为九方金融研究所,且不得对本报告进行有悖于原意的引用、删节和修改。 本报告由研究助理协助资料整理,由投资顾问撰写。本报告的信息均来源于市场公开消息和数据整理,本公司对报告内容(含公开信息)的准确性、完整性、及时性、有效性和适用性等不做任何陈述和保证。本公司已力求报告内容客观、公正,但报告中的观点、结论和建议仅反映撰写者在报告发出当日的设想、见解和分析方法应仅供参考。同时,本公司可发布其他与本报告所载资料不一致及结论有所不同的报告。本报告中的信息或意见不构成交易品种的买卖指令或买卖出价,投资者应自主进行投资决策,据此做出的任何投资决策与本公司或作者无关,自行承担风险,本公司和作者不因此承担任何法律责任。 投资顾问:王德慧(登记编号:A0740621120003) |
免责声明:以上内容仅供参考学习使用,不作为投资建议,此操作风险自担。投资有风险、入市需谨慎。
推荐阅读
相关股票
相关板块
相关资讯
扫码下载
九方智投app
扫码关注
九方智投公众号
头条热搜
涨幅排行榜
暂无评论
赶快抢个沙发吧