荣格工业资源APP
了解工业圈,从荣格工业资源APP开始。
2026年春晚,宇树机器人的武术表演不仅带来了一场极具冲击力的视觉盛宴,更标志着人形机器人运动控制技术路线在Demo阶段实现全面收敛。从春晚舞台上惊艳全网的“赛博真功夫”,到如今OmniXtreme核心技术的全面开源,宇树科技用实际行动告诉所有人:中国人形机器人技术,已经从跟跑走到了领跑。流匹配技术的落地、双阶段训练框架的创新、核心技术的开源,每一步都在打破行业的技术壁垒,推动着具身智能的工业化发展。

当技术演示的“天花板”已然清晰,行业更需要冷静审视两个核心问题:支撑这些高动态动作的技术演进逻辑究竟是什么?而从“能表演”到“创造价值的生产力工具”,人形机器人真正的商业化Check Point又在何处?
作为具身智能行业的从业者,在跟踪一年科研与市场发展后,我们希望借此次春晚技术热点,做一次行业技术与商业闭环认知的阶段性总结。聊技术与算法,是为了明确行业当下的发展坐标与未来的技术方向;聊商业场景与落地,是为了与行业同仁共同探索产业价值,让具身智能行业的“蛋糕”真正做大。
一、春晚级表演的技术内核:三大维度构筑表演技术栈
能实现春晚这样高规格、高成功率的人形机器人群体表演,其背后并非单一技术的突破,而是一套多维度交织的完整技术栈支撑,核心围绕控制-感知-协同三大核心环节展开,也是当前人形机器人运动控制领域的技术共识。
人形机器人依赖多种关键技术使其能够自主运行并与环境有效互动,包括环境感知、自主导航、运动控制和智能操作。其中,运动控制是支撑所有高动态动作的基础——它使人形机器人能在复杂环境中使用四肢导航,面临在行走、奔跑或穿越不平坦地形时保持平衡的挑战。
感知与定位层(Perception & Localization):3D感知融合的精准空间锚定
核心在于3D LiDAR(激光雷达)与视觉方案的技术融合。本次春晚表演中,机器人通过板载3D LiDAR完成实时场景扫描与定位,如同自动驾驶的高精地图构建,为群体演出的空间坐标提供绝对精准度,从底层避免阵列偏移。这一技术选择,也预示了人形机器人感知路线的发展必然。
运动小脑层(Locomotion/WBC):强化学习与模仿学习的融合范式
这是实现高动态武术动作的核心环节,行业已形成强化学习(RL)+ 模仿学习(IL)的融合共识。运动控制领域的研究方法主要可分为两大技术路径:
基于模型的方法以平衡控制器为核心,研究基于运动学和动力学建模的稳定性标准和规划控制方法。稳定性标准如零力矩点(ZMP)、压力中心(CoP)和捕获点在人形机器人控制中广泛采用;质心(CoM)运动规划方法、混合零动态(HZD)方法和模型预测控制(MPC)也是常用技术。这些方法具有高可解释性,但依赖准确建模和手动参数调整。
基于学习的方法则利用数据驱动技术从经验中学习运动策略,适用于传统模型难以捕捉复杂互动的环境。其学习范式主要基于PPO、SAC等经典算法,在IsaacLab/Mujoco等仿真环境中完成海量训练,再通过Sim2Real技术将仿真模型部署至真机,实现从虚拟到现实的动作迁移。
基于强化学习的控制器从机器人传感器接收观测状态和参考轨迹,控制机器人动作。这些方法在处理高自由度、复杂动力学模型和传感器限制方面表现优异,同时赋予机器人“自主姿态调整”能力——例如空翻落地不稳时,机器人可根据实时状态反馈完成动态重平衡(Dynamic Rebalancing),而非机械执行预设动作序列,这是高动态动作成功率的关键。
同时,人类数据(动捕/视频)映射到机器人身上解决了人形机器人“向谁学、怎么学”的核心问题,背后的技术点是重定向与数据增强(Retargeting & Data Augmentation)。运动重定向技术将源角色的运动数据转移到目标角色,如Holden等人使用共享潜在变量模型适应不同人形角色间的运动。通过来自斯坦福的GMR等重定向算法,将人类高难度武术动作的动捕数据精准映射到机器人的关节结构上,让机器人能够复刻人类的复杂肢体动作,为后续训练提供高质量的原始数据。
这套技术栈的背后,是一套成熟的Motion Tracking(动作追踪)工作流:采集人类动捕数据→数据重定向到机器人关节→仿真环境中完成RL/IL训练→Sim2Real技术部署实机。这一工作流的演进,也见证了运动控制技术的关键Milestone:2018年伯克利DeepMimic首次证明动捕数据+RL可训练出空翻等高难度动作;后续AMP引入对抗学习,解决了机器人动作僵硬的问题,让步态更贴近人类。来自伯克利的BeyondMimic作为去年下半年的milestone之一,更是把运动控制的门槛降到一般开发者的水平。近期,香港科技大学发布的HumanX项目,也主要解决了在物体交互层面中复杂运动控制泛化性的问题。
需要明确的是,本次春晚中的机器人,执行的是预先训练好的运动策略,而非在舞台上实时生成动作。因此,其展示的是人形机器人高质量的运动控制能力,而非通用智能——这也是当前行业技术发展的真实坐标。
而学界在感知层的技术探索,正让人形机器人从“固定场景”走向“真实世界”。清华大学Project Instinct(Deep Parkour Learning 和 Hiking in the wild)、Amazon的PH Parkour等研究成果,展示了如何通过板载深度相机让机器人自主判断地形、动态调整落脚点,解决了机器人上任意台阶等行业长期难题。
未来,人形机器人的科研探索战场将聚焦三大方向:更多模态的通用控制器、具备泛化与交互能力的HSI HOI Agent、以及VLA/World Model的技术突破。在技能学习层面,训练机器人获取和改进执行任务所需的运动技能正成为热点——单任务技能学习针对特定动作,如灵巧手操作和双臂协调;多任务技能学习开发统一策略处理多种任务,利用大型视觉语言模型提取结构化任务和环境信息;长时操作涉及长时间内执行一系列动作的任务,通常通过层次化强化学习或层次化模仿等方法解决。
群控与协同平台(Cluster Control):中心化+分布式的群体协同逻辑
春晚级的群体表演,核心依赖中心化控制台+分布式执行的协同架构:服务器统一分发轨迹指令,各机器人自主监控自身动作偏差,并实时完成回归阵列的调整,既保证了群体动作的一致性,又通过分布式执行提升了整体表演的容错率。
二、技术路线收敛后:人形机器人的商业Checkpoint在哪里?
当Demo阶段的技术路线趋于收敛,行业的核心命题从“如何做技术演示”转向“如何实现商业落地”。回顾过去一年的市场现状,人形机器人已形成科研教育、商演、ToG采购的初步商业闭环,但整体仍处于“新瓶装旧酒”的阶段,尚未实现真正的消费级价值的创造。而从现有市场到未来的生产级市场,不同赛道的商业逻辑与核心抓手各有不同,也是行业接下来的核心探索方向。
1. 商演市场:从“练习生模式”到“人机交互生态”
当前的商演市场,本质是“流量IP运营+技术练习生”模式:硬件成本虽逐步下降,但动作开发成本与现场执行的人力投入仍是核心成本项。不过,行业已出现明确的降本趋势:多家企业正搭建标准化的开发平台(即行业所称的“通用小脑”),本体企业聚焦硬件生态拓展,平台企业则通过SaaS模式收取技术服务费,实现运动控制开发的标准化、规模化。再往后,控制层面的产品功能不会和硬件解耦,而是全厂家自带,平台企业的SaaS模式将会逐步萎缩。
商演市场的未来破局点,不在于单纯的“机器人表演”,而在于将人类融入机器人的互动场景,实现与文娱、游戏产业的深度嫁接。当硬件接口足够成熟、成本进一步降低、安全性得到充分验证,类似《铁甲钢拳》的真人遥操格斗、人机协同的舞台表演等互动形式,将释放巨大的商业流量,这也是商演市场从“观赏性”到“参与性”的核心升级方向。
2. 科研教育:高地卡位与存量市场的生存博弈
科研市场是人形机器人行业的战略高地,同时也是依赖生态、具有强标杆效应的寡头市场,企业之间的发展方差显著。布局科研市场的核心价值在于能接触到一线的技术洞察,形成对行业未来的视野优势。因此,除了机器人本体企业,核心零部件公司仍可通过为maker市场供货,持续维系与科研端的技术连接,卡位行业高地。
教育市场则是接下来两年行业内卷的核心存量市场,本质仍处于“新瓶装旧酒”的阶段,尚未出现突破性的产品形态。这一市场的核心竞争维度,将聚焦于量产交付能力、产品完善度与ToB商业化能力,也是当前已入局的企业维系独立生长能力的关键。
3. 未来战场:三条分化路径,回归价值创造
从长期来看,人形机器人的商业未来,行业创业方向已呈现出三条清晰的分化路径,且行业整体正回归理性,“大浪淘沙”下只有创造真实价值的产品才能留存:
做行业入口/通用平台:依托技术优势搭建标准化的技术开发平台,仍有不少行业优化的机会可以捕捉,核心是降低全行业的开发门槛;
做下游应用落地:聚焦家庭等C端场景的产品探索,本质都是为消费级市场蓄势,核心工作围绕降低开发门槛、提升产品安全性展开;
项目制技术服务:短期内仍能获得一定的订单,但市场空间有限,难以形成可持续的商业闭环,不过还是可以作为创业起号有现金流的机会。
当前人形机器人运动控制技术的路线收敛,是行业的重要里程碑,也为后续的商业探索奠定了技术基础。从科研实验室到产业落地,从技术Demo到价值创造,我们仍处于漫长的爬坡阶段。
总之,现在行业回归理性了,大浪淘沙,有真正价值的产品会留下。而人形机器人的未来,从来都不是某一个企业的孤军奋战,而是全行业的协同创新。OmniXtreme的开源,只是一个起点,更是一个信号:属于人形机器人的黄金时代,已经真真切切地到来了!

