摘要
2026 年是人形机器人的量产元年。这一判断并非预测,而是已经发生的事实:截至 2025 年底,全球人形机器人出货量突破 1.7 万台,其中中国厂商贡献约 1.44 万台,占全球份额 84.7%;宇树科技单款双足人形机器人累计下线突破 11,000 台,稳居全球第一;智元机器人三条产品线累计量产突破 5,000 台;优必选 Walker S1 在比亚迪、极氪、吉利等汽车工厂完成多轮规模化实训,并斩获全球单笔最大人形机器人商业订单 2.5 亿元。与此同时,特斯拉 Optimus 在 Fremont 工厂全天候运作,Figure AI 的 Figure 02 在宝马 Spartanburg 工厂支撑了逾 3 万辆 BMW X3 的生产,Apptronik Apollo 进驻梅赛德斯-奔驰柏林数字工厂园区。
这场量产浪潮由三股力量共同驱动:第一,以特斯拉 Optimus 和 Figure AI 为代表的美系大厂,凭借端到端 AI 与制造业生态优势,将人形机器人拉入汽车产线;第二,以宇树、智元、优必选为核心的中国阵营,凭借成本优势和完整供应链,在 2025 年完成了从"样机展示"到"批量交付"的关键跨越;第三,以 Agility Robotics 为代表的仓储派,在物流场景率先实现了可量化的商业闭环——Digit 在 GXO 仓库累计搬运超 10 万个料箱,树立了行业参照标杆。
推动这一浪潮的技术底座是具身智能大模型的爆发式发展。NVIDIA 于 2025 年 3 月在 GTC 大会发布 Isaac GR00T N1——全球首个开源人形机器人基础模型;Figure AI 的 Helix 系统实现了双臂协作的零样本泛化;智元发布 GO-1 具身大模型,覆盖远征 A2 和灵犀 X1 两大产品线。模型能力的持续提升,正在推动人形机器人从"示教复现"向"语言驱动的开放任务"跨越,泛化能力的边界每隔 6–12 个月就被重新定义。
在零部件供应链侧,中国国产化进程正在显著加速。绿的谐波(688017)谐波减速器 2025 年全年销量 42.52 万套,同比增长 72.48%,净利润翻倍;贝斯特(300580)行星滚柱丝杠量产在即,目标 2026 年批量供货;汇川技术(300124)伺服电机国产份额达 27.6%,居国内第一。从减速器到丝杠、从电机到传感器,人形机器人供应链正在快速完成从依赖进口到国产主导的结构性转变,这一转变将在 2026–2028 年显著压缩整机成本。
关键数据速览:
- 2025 年中国人形机器人出货量约 1.44 万台,全球占比 84.7%;2026 年预计出货量约 6.25 万台(TrendForce),同比增长约 94%。
- 2030 年中国人形机器人市场规模预计约 8,700 亿元(中国电子学会);全球出货量有望达 120 万台,中国占比超 85%。
- 价格曲线加速下探:2025 年工业整机约 30–65 万元,2026 年主流机型目标 20–30 万元,2028–2030 年有望突破 10 万元以下。
- 一级市场活跃:2025 年中国人形机器人赛道融资约 200 亿元;宇树科技科创板 IPO 于 2026 年 3 月获受理,拟募资 42 亿元,估值约 420 亿元。
- 宇树科技 FY2025 全年营收 16.99 亿元,扣非净利润 5.9 亿元,人形机器人全球市占率约 32.4%,居全球第一。
- 绿的谐波 FY2025 全年营收 5.71 亿元,同比增长 47.31%,净利润同比翻倍,谐波减速器年销量 42.52 万套,同比增长 72.48%。
核心判断如下:
- 2026 年量产元年的核心命题不是"能不能造出来",而是"能不能在量产规模下把成本打穿"。当前具身智能模型仍是最大不确定性,其泛化能力决定了人形机器人能否跨越工厂"固定工位"进入"柔性产线"。从一个工位到全产线,是量产元年真正需要跨越的那道坎。
- 中国阵营的结构优势在成本与供应链,而非模型能力。在具身大模型领域,美国仍领先中国约 12–18 个月;但在零部件国产化、产线制造成本和垂直应用场景上,中国正在形成不可逆的竞争护城河。从谐波减速器国产化率从 2023 年约 40% 提升至 2025 年约 65% 这一数字,可以清晰看到供应链迭代的速度。
- 从应用场景渗透路径看,"工厂固定工位→仓储物流→商用服务→家庭服务"四级落地仍是主旋律,2026–2028 年的核心战场是汽车/3C 工厂与物流仓储,家庭场景最早到 2030 年才可能形成规模市场。
第一章 定义、分类与产业链全景
1.1 人形机器人的定义与本质
人形机器人(Humanoid Robot),在学术定义中是指具有与人类相似的形态结构——拥有头部、躯干、双臂和双腿——并能够在为人类设计的环境中自主运动和执行任务的机器人系统。这一定义有两个核心要素:其一,形态仿人;其二,场景泛化——能够在人类生活和工作的非结构化环境中自主行动,而非只能在固定工位上执行预编程任务。这两个要素缺一不可:只有形态仿人而没有场景泛化能力的机器人,本质上只是一台可以走路的工业机械臂;只有泛化能力而没有仿人形态的系统,本质上只是一个移动机器人平台。
形态仿人不是目的,而是手段。现有工厂自动化设备——机器人机械臂、AGV、协作机器人——已经可以高效完成特定结构化场景的自动化,但无法处理需要双手协调操作、需要在人类空间中自由行走、需要与人类并肩工作的场景。人形机器人的形态设计,使其天然适配为人类设计的工作环境:能操作人类工具、使用人类制造的门把手、走上为人类设计的楼梯、在人类产线旁执行协作任务,本质上是将现有的人类工作基础设施(工厂、仓库、厨房)变成机器人也能使用的通用平台,而无需为机器人专门重建基础设施。
从工程实现角度,当代人形机器人的技术难点集中在三个层面:
其一,机械结构。全尺寸人形机器人通常拥有 20–40 个自由度(DOF),其中双腿约 12 DOF、双臂约 14 DOF、双手约 10–22 DOF,躯干 2–4 DOF,头部 1–3 DOF。高自由度意味着大量关节执行器,每个执行器都需要在满足力矩、转速、重量和功耗约束的前提下保持高可靠性。在量产场景下,任何单个关节执行器的设计缺陷都会被放大到整批次产品上,这是造成早期量产机型一致性问题的核心原因。
其二,感知系统。人形机器人需要在三维非结构化环境中实时感知自身位姿、周边障碍物和操作对象的状态。主流感知方案包括:RGB-D 深度相机用于近距离物体识别和抓取,激光雷达用于全局定位和避障,IMU(惯性测量单元)用于姿态估计,六维力/力矩传感器用于接触力反馈,触觉传感器阵列用于手指灵巧操作。感知系统的成本在整机 BOM 中约占 15%–25%,且随着传感器国产化的推进正在持续下降。
其三,具身智能。这是当代人形机器人最核心的技术瓶颈,也是决定机器人市场边界的关键变量。传统机器人控制依赖精确的环境建模和预编程轨迹,一旦环境稍有变化即告失败。具身智能的目标是让机器人能够像人类一样,通过观察和交互学习新任务,并将已学知识泛化到新场景。当前主流技术路径包括模仿学习(Imitation Learning)、强化学习(Reinforcement Learning)和大型语言/视觉模型驱动的端到端控制(End-to-End Control)。这三条路线并非互斥,而是在实践中以不同比例组合,形成各家整机厂的差异化 AI 系统。
理解人形机器人的本质还需要理解它与两类相近产品的边界。与工业机器人(固定机械臂)的边界在于:人形机器人具备移动能力和双臂协调能力,能够在工厂产线上自主行走、换工位、抓取搬运;而工业机械臂固定在特定工位,只能在其工作半径内执行预编程任务。与服务机器人(轮式移动机器人)的边界在于:全双足人形机器人具备在非平整地面行走的能力,能够上下楼梯、跨越障碍,适应力远强于轮式平台;同时,仿人双臂使其能够操作为人类设计的工具和设施,而非只能通过特殊适配接口与环境交互。
1.2 分类体系
人形机器人按形态结构、尺寸规格、应用场景和关节驱动方式四个维度交叉分类,任意一款商用机型都可以在这四个维度上找到对应的技术标签。
按形态结构分类:
全双足人形机器人是最接近人类形态的机器人类型,采用两条腿行走,具备完整的上下肢结构。全双足的工程难度最高,行走稳定性控制(全身动态平衡)是其核心技术挑战,但对非结构化地形(坡道、台阶、碎石地面)的适应性最强,是未来进入家庭和服务场景的唯一可行形态。代表型号:宇树 H1/H2、特斯拉 Optimus Gen 2、Figure 02/03、优必选 Walker S1、智元远征 A2、傅利叶 GR-1、逐际动力 CL-1。
轮式人形机器人的上半身仿人(双臂、头部、躯干),下半身采用轮式底盘(差速轮、麦克纳姆轮或升降腿轮复合)。相比全双足,轮式底盘大幅降低了运动控制复杂度,同时获得了更高的移动速度和更长的续航。代价是无法应对台阶、坡道等非平整地形。适合平地仓储物流和商用服务场景。代表型号:智元远征 A2-W、智元远征 A2-D(移动底座)、达闼 HARIX 轮式版本。
固定/移动底座双臂机器人保留了人形的双臂上肢设计,但放弃了整体移动能力(固定底座)或采用 AGV 底盘代替腿足(移动底座)。这类平台是当前工厂精密操作场景的过渡方案,部署成本和技术门槛远低于全尺寸人形机器人,适合需要双手协调操作但不需要自主行走的工位。代表型号:智元小元系列、ABB YuMi 延伸产品线。
按尺寸规格分类:
全尺寸(Full-Size)人形机器人身高 160–180cm,体重 50–80kg,承重 20–55kg,是工业场景的主力机型。Optimus Gen 2 身高约 173cm、体重约 57kg;Figure 02 约 167cm、约 70kg;宇树 H1 约 180cm、约 47kg;优必选 Walker S1 约 171cm、约 70kg。全尺寸机型的设计出发点是最大程度适配现有工厂基础设施(标准门洞、标准工作台高度、标准托盘规格),实现"即插即用"式部署。
中尺寸(Mid-Size)人形机器人身高 120–150cm,体重 25–50kg,与人共处更安全,在商业服务和家庭服务场景中有更好的接受度。宇树 G1(127cm,约 35kg)是中尺寸段覆盖面最广的商用机型,售价 9.9 万元,成为全球人形机器人研究者最广泛使用的平台之一。
桌面/教育型(Desktop/Research)机器人身高 30–80cm,体重 1–15kg,主要面向高校和企业的算法研究,商业应用价值有限,但对推动具身 AI 算法生态的发展有重要贡献。
按应用场景分类:
工业制造型机器人面向工厂产线,目标替代高重复性、高强度的体力劳动岗位(搬运、上下料、焊接辅助、品检)。对机器人的要求:高负载(20–55kg 承重)、高可靠性(MTBF 目标 5,000 小时以上)、抗粉尘防水(IP54 以上)、低场景迁移成本(新工位适应时间 < 1 天)。
物流仓储型机器人在仓库环境中完成拣货、打包、料箱搬运等任务。对机器人的要求:全向移动能力、货架操作接口、4 小时以上续航、可靠的 3D 物体检测(货架条码扫描和物体抓取)。
商用服务型机器人在酒店、商场、医院等公共场景提供引导、接待、巡检服务。对机器人的要求:流畅的自然语言对话能力、自主导航和障碍物规避、外观设计友好(降低公众安全顾虑)。
家庭服务型机器人是人形机器人最终极的市场目标,预计 2030 年及以后才会形成规模市场,核心挑战是具身大模型在完全非结构化的家庭环境中实现泛化。
科研开发型机器人是高校和企业研究团队算法验证的载体,不要求商业可靠性,优先开放 SDK 和传感器接口的扩展性。
按关节驱动方式分类:
谐波减速器驱动利用柔轮弹性变形实现大减速比(通常 50:1–160:1),具有重量轻、体积紧凑、传动精度高(传动误差通常小于 1 弧分)、无背隙的优点,适合肘关节、腕关节等空间受限且精度要求高的关节。国内代表供应商:苏州绿的谐波(688017);日本代表:哈默纳科(Harmonic Drive)。
RV 减速器驱动采用摆线针轮传动,适用于高负载、高刚度应用(髋关节、膝关节、踝关节),抗冲击能力强、使用寿命长,但体积和重量较谐波减速器更大。国内代表:双环传动(002472)、中大力德(002896);日本代表:纳博特斯克(Nabtesco)。
行星滚柱丝杠直线驱动将旋转运动转化为高力矩直线运动,用于腿部直线关节执行器(线性驱动器),是特斯拉 Optimus 和 Figure 系列采用线驱腿部设计的核心零件,单台人形机器人通常需要 6–14 根。代表供应商:贝斯特旗下宇华精机(国产,量产中)、Exlar(美国)、力士乐(德国)。
无框力矩电机直驱无需减速器,直接通过高扭矩密度无框电机驱动关节,响应速度快、结构简洁、反向驱动性好,适合需要高带宽力控的关节设计。代表应用:宇树 H1/H2 部分关节。
1.3 产业链全景
人形机器人产业链纵深较长,从上游核心零部件到中游整机制造与软件平台,再到下游系统集成与最终应用,每个环节都有其独特的技术壁垒和竞争格局。
上游核心零部件(技术壁垒最高、成本占比最大):
关节执行器系统是整机 BOM 成本中占比最高的模块,通常占 35%–50%。一台全尺寸人形机器人拥有 20–60 个执行器,包括驱动电机、减速机构(谐波/RV/行星滚柱丝杠)和位置/力矩传感器三个子系统。谐波减速器是其中技术壁垒最高的单品,日本哈默纳科的产品精度和可靠性长期是全球最高水准的参考标准,中国国产化率已从 2023 年约 40% 提升至 2025 年约 65%(以绿的谐波为龙头)。
感知系统约占整机 BOM 的 15%–25%,包括:RGB-D 深度相机(国内代表:奥比中光)、固态激光雷达(速腾聚创、禾赛)、六维力/力矩传感器(坤维科技、宇立仪器)、触觉传感器阵列(帕西尼感知、触想智能等初创)、IMU(国内外均有成熟供应)。
计算平台目前以 NVIDIA Jetson Orin/Thor 为主流,提供高算力密度的边缘 AI 推理能力;国内替代方向有华为昇腾、地平线 J 系列(智能驾驶 SoC 向机器人迁移)。
电源系统:锂离子电池组(NCM 体系,0.5–1kWh),宁德时代和亿纬锂能均有定制电池模组合作项目。
结构件:碳纤维复合材料骨架、铝合金精密压铸件、3D 打印钛合金件。
中游整机制造与软件平台:
整机研发与制造是产业链的价值核心,涵盖机械结构设计、感知-控制系统集成、出厂标定测试和售后服务。当前全球整机制造厂商已超过 140 家,其中中国占绝大多数,但真正进入量产交付(年出货量超 100 台)的企业不足 10 家。
具身大模型与控制软件是未来竞争的最关键差异化维度,主要平台包括:NVIDIA Isaac GR00T N1(开源)、Figure Helix(私有)、智元 GO-1、特斯拉 FSD-Style E2E 迁移版本、优必选自研大模型框架。
仿真平台与训练基础设施:NVIDIA Isaac Sim(基于 Omniverse 的高保真物理仿真)、MuJoCo(Google DeepMind 开源,学术界最广泛使用)、Genesis(MIT 团队,高速 GPU 并行仿真)、Cosmos(NVIDIA 世界模型,用于合成数据生成)。
下游系统集成与应用:
系统集成商负责将整机与客户工厂的 MES/WMS/ERP 系统打通,完成工位适配、安全围栏设计、工艺调试和操作人员培训。这一环节目前高度分散,尚未出现规模化的独立系统集成商,整机厂普遍自建或与机器人集成商合作。
最终应用客户包括:汽车主机厂(比亚迪、吉利、特斯拉、宝马、梅赛德斯-奔驰)、电子制造企业、物流仓储运营商(亚马逊、GXO、京东物流、顺丰)和公共服务机构。
全产业链的核心痛点目前集中在两处:一是关节执行器的成本和可靠性——一台全尺寸人形机器人通常有 14–30 个关节,每个关节的执行器成本在 5,000–50,000 元不等,构成整机成本的 40%–60%;二是具身大模型的泛化能力——当前最先进的模型仍难以处理高度非结构化的任务,导致机器人实际可用场景受限于"示教覆盖范围"。
1.4 上游供应链分层结构
为了更系统地理解产业链的技术分工,以下对上游各子系统进行更精细的分层梳理:
第一层:关节力矩输出层(执行器)
这一层是人形机器人的"肌肉"系统,直接决定机器人的力量和速度。包括:无框力矩电机(产生原始驱动力矩)、减速机构(将电机高转速/低力矩转换为低转速/高力矩)、编码器/位置传感器(反馈关节角度)、驱动控制器(电流/力矩闭环控制)。当前这一层的国产化程度在主要子系统中参差不齐:无框电机国产化率约 70%,谐波减速器约 65%,RV 减速器约 55%,行星滚柱丝杠约 15%(量产阶段),驱动控制器约 80%。
第二层:感知反馈层(传感器)
这一层是人形机器人的"神经系统",为控制系统提供环境感知和接触反馈信号。六维力传感器(手腕、踝关节处的关键力矩反馈)、触觉传感器阵列(指尖接触力分布,灵巧手操作必备)、RGB-D 深度相机(近场视觉感知)、激光雷达(全局环境感知与建图)、IMU(全身姿态估计)、关节温度传感器(热保护)。
第三层:计算感知融合层(Computing Platform)
这一层是人形机器人的"大脑",运行从感知数据到动作指令的完整 AI 推理链路。NVIDIA Jetson Thor(800 TOPS,边缘 AI SoC 主流选择)、高通机器人计算平台(部分机型采用)、自研计算板(宇树、优必选部分高端机型)。这一层的技术壁垒主要体现在:算力密度(单位重量/体积的 TOPS 数)、功耗效率(延续续航的关键)和 I/O 丰富度(同时接入多类传感器)。
第四层:能源供给层(Power System)
这一层直接决定机器人的续航时间和运动性能上限。当前人形机器人的峰值功耗约 1–3kW(全力奔跑+双臂操作),持续工作功耗约 0.5–1kW,对应电池容量需求约 0.5–1kWh(目标续航 2–4 小时)。磷酸铁锂电池(高安全性)和高镍 NCM 电池(高能量密度)是两种主流选择,前者更安全(工厂部署优先),后者续航更长(服务场景优先)。电池热管理系统是人形机器人长时间工作可靠性的重要保障,三花智控的热管理执行器在这一场景有重要应用。
1.4 典型人形机器人整机参数对比(2025 年商用机型)
以下对 2025 年已进入批量交付阶段的主要商用人形机器人机型进行参数横向比较,为工厂客户的选型决策提供参考依据:
| 机型 | 企业 | 身高(cm) | 体重(kg) | 承重(kg) | 全身 DOF | 手部 DOF | 整机售价 | 主要应用场景 |
|---|---|---|---|---|---|---|---|---|
| Optimus Gen 2 | 特斯拉 | 173 | 57 | 20 | 28 | 11(每手) | 内部使用 | 汽车工厂 |
| Figure 02 | Figure AI | 167 | 70 | 25 | 32 | 16(每手) | 定制 | 汽车工厂 |
| H1 | 宇树科技 | 180 | 47 | 30 | 19 | 12(每手) | 约 65 万元 | 工业/科研 |
| H2 | 宇树科技 | 176 | 50 | 30 | 40+ | 20+(每手) | 约 50 万元 | 工业量产 |
| G1 | 宇树科技 | 127 | 35 | 15 | 23 | 10(每手) | 9.9 万元 | 开发者/科研 |
| Walker S1 | 优必选 | 171 | 70 | 40 | 41 | 11(每手) | < 30 万元 | 汽车工厂 |
| 远征 A2 | 智元机器人 | 175 | 63 | 35 | 50 | 14(每手) | 约 45 万元 | 汽车/制造 |
| GR-1 | 傅利叶智能 | 165 | 65 | 50 | 40 | 12(每手) | 约 70 万元 | 工业/康复 |
| PM01 | 众擎机器人 | 164 | 60 | 25 | 35 | 12(每手) | 8.8 万元起 | 开发者/服务 |
| Apollo | Apptronik | 173 | 73 | 25 | 28 | 可换末端 | 定制 | 汽车工厂 |
| Digit | Agility | 175 | 65 | 16 | 16 | 夹持器 | RaaS | 仓储物流 |
注:上表数据综合自企业官方公告和行业媒体报道,部分参数为近似值或目标值;承重、DOF 和售价随机型版本迭代有所调整,投资和采购决策应以企业最新官方文件为准。
从上表可以提取几个关键趋势:第一,宇树科技的三款产品覆盖了从 9.9 万元到 65 万元的广泛价格区间,形成了最完整的产品矩阵,同时服务开发者生态和工业量产需求;第二,工业型全尺寸机型的体重集中在 47–73kg 区间,对地面承压和货梯限重有一定影响,需要工厂在部署规划时纳入考量;第三,灵巧手 DOF 的差异显著(10–20+ DOF),直接影响精密操作工位的适用性;第四,整机售价仍处于高速下降通道,2024–2025 年两年内工业全尺寸机型均价从约 100 万元降至约 40–50 万元,降幅约 50%,2026 年预计继续下探至 20–35 万元。
1.5 中国人形机器人产业链与国际标准接口
中国人形机器人产业在快速发展的同时,也在积极参与国际标准的制定和兼容。这对于产品出口和国际合作至关重要,也是判断国内整机厂能否进入全球供应链的重要依据。
ISO 标准体系:ISO 8373《机器人与机器人设备——词汇》是人形机器人定义和分类的国际基础标准;ISO/TS 15066《协作机器人——安全要求》规范了人机协作场景的速度限制(手部 250mm/s、全身 150mm/s 在协作模式下)和接触力限制(< 135N 瞬态力、< 65N 准静态力)。中国人形机器人企业普遍以 ISO/TS 15066 作为工厂协作安全设计的参考标准,但在实际部署中,由于工厂场景的力矩需求超出协作限制,大多数工位仍采用物理隔离而非真正的协作安全设计。
ROS 2(Robot Operating System 2):ROS 2 是当前全球使用最广泛的机器人中间件框架,为传感器数据传输、节点间通信和工具链提供统一接口。国内主流人形机器人整机厂(宇树、智元、傅利叶)均提供 ROS 2 兼容的开发接口,使国际开发者能够快速在国产整机上验证算法,并与全球机器人算法生态无缝集成。这一兼容性是宇树 H1/H2 能够在全球 30+ 国家高校成功落地的重要原因之一。
NVIDIA Isaac ROS:Isaac ROS 是基于 ROS 2 的加速计算图像处理框架,专为 NVIDIA Jetson 平台优化,提供了从相机驱动到视觉里程计、三维建图、物体检测的完整算法加速包。国内整机厂通过集成 Isaac ROS,能够以较低的开发成本获得 GPU 加速的感知算法性能,同时与全球 ROS 生态保持兼容。
具身 AI 模型格式的互操作性:ONNX(Open Neural Network Exchange)和 TensorRT 是当前 AI 模型在不同硬件平台间移植的主流格式。宇树、智元的具身大模型均支持导出为 ONNX 格式并在 Jetson 上以 TensorRT 加速推理,为后续切换计算平台(如国产华为昇腾)提供了灵活性。
1.5b 人形机器人产业链关键经济指标速查
以下汇总 2025 年人形机器人产业链各环节的关键经济指标,为产业链分析提供数据基础:
整机层面:
- 全球出货量:约 1.7 万台(2025 年全年)
- 中国出货量:约 1.44 万台(占全球 84.7%)
- 中国市场规模:约 15.5 亿元
- 宇树科技营收:16.99 亿元(净利润 5.9 亿元,全球市占率 32.4%)
- 优必选营收:约 16.2 亿港元
- 单台整机均价范围:8.8 万元(PM01,开发者版)至约 70 万元(GR-1,工业版)
- 工业全尺寸机型均价:约 40–50 万元(2025 年),预计 2026 年降至约 25–35 万元
关节执行器层面:
- 谐波减速器国产化率:约 65%(绿的谐波为国内最大厂商)
- 绿的谐波 FY2025 谐波减速器销量:42.52 万套,均价约 1,320 元/套
- RV 减速器国产化率:约 55%(双环传动为主)
- 行星滚柱丝杠国产化率:约 15%(贝斯特量产推进中)
- 无框电机国产化率:约 70%(汇川技术为最大供应商)
- 每台全尺寸人形机器人平均关节执行器数量:约 20–40 个
- 关节执行器占整机 BOM 成本比例:约 35%–50%
传感器层面:
- 六维力传感器进口依存度:约 60%(ATI、Kistler 为主流进口品牌)
- 深度相机国产化率:约 75%(奥比中光为国产龙头)
- 固态激光雷达国产化率:约 80%(速腾聚创、禾赛为主)
- 触觉传感器商用成熟度:偏低,多数量产机型尚未标配
计算平台层面:
- NVIDIA Jetson Orin(275 TOPS):约 3,500–5,000 元/片,是当前主流边缘 AI 平台
- NVIDIA Jetson Thor(800 TOPS):约 8,000–12,000 元/片,正在切换为新一代标准
- 国产替代(昇腾、地平线):覆盖部分场景,算力效率约为 Jetson 的 60–80%
资本市场层面:
- 中国人形机器人赛道 2025 年一级融资总额:约 200 亿元
- 宇树科技 IPO 拟募资:42.02 亿元(2026 年 3 月科创板申报获受理)
- 智元机器人估值:超过 150 亿元(2025 年最新融资后)
- 绿的谐波(688017)2025 年净利润:1.24 亿元(同比翻倍)
1.6 竞争格局的历史类比与行业生命周期
将人形机器人产业的发展阶段与历史上类似技术产业的演进路径进行类比,有助于判断未来竞争格局的演变方向。
最接近的历史类比是新能源汽车(2015–2025 年):新能源汽车从样车展示到规模量产,经历了约 8–10 年的技术和商业模式成熟周期,在此过程中经历了大量早期玩家退出(国内 NEV 初创曾超过 500 家,存活到 2025 年规模化出货的不超过 20 家)、核心技术国产化替代(电池、电机、电控的"三电"国产化)和成本快速下降(2015–2025 年 10 年内电池成本下降约 90%)三个阶段。
人形机器人与 NEV 的深层相似性在于:都是以"机电一体化 + AI 软件"为核心的复杂系统产品;都依赖关键零部件的国产化提升来压缩成本;都面临从"样机展示"到"规模量产"的可靠性鸿沟;都受益于中国完整的制造业供应链生态。但差异同样显著:人形机器人的软件复杂度(具身大模型)远高于 NEV 的软件复杂度(电池管理 BMS + ADAS),这意味着人形机器人产业的演进周期可能比 NEV 更长,技术瓶颈(具身大模型泛化)比 NEV(电池能量密度)更难以量化预测。
另一个参照是工业机器人(2010–2020 年的国产化历程):2012 年,中国工业机器人市场由发那科(Fanuc)、安川电机(YASKAWA)、ABB、库卡(KUKA)"四大家族"主导,国产品牌市场份额不足 10%;经过约 10 年的国产化推进,到 2022 年,国产工业机器人(埃斯顿、汇川、华数等)的市场份额提升至约 28%,在中低端市场取得了实质性突破,但高端多关节机器人仍以进口为主。人形机器人的国产化进程将会比工业机器人更复杂(技术层次更多),但也可能更快(政策支持力度更强、资本更集中)。
产业成熟期的集中度规律:从历史规律看,复杂系统产品(汽车、智能手机、工业机器人)在产业成熟期(量产 5–10 年后)的 CR3 通常在 50%–70% 之间,长尾市场由垂直场景专家和价格段专家分割。预计人形机器人产业在 2030 年的竞争格局,将呈现出:CR3 约 50–60%(宇树/特斯拉/智元可能占据前三);垂直场景专家(仓储专家如 Agility、服务专家如达闼、医疗专家如傅利叶)占据各自细分市场约 20–30% 份额;低价位长尾企业(众擎等)争夺 10–20% 的价格敏感市场。
第二章 全球竞争格局与海外主要玩家
2.1 全球格局概览
截至 2026 年初,全球人形机器人市场格局呈现出"美系大厂主导 AI 与生态、中国阵营主导量产规模、欧洲玩家寻求垂直场景突破"的三角结构。从出货量看,中国已成为全球最大的人形机器人生产国,2025 年中国人形机器人出货量约 1.44 万台,占全球 84.7%;但从模型能力、融资单笔规模和下游生态影响力来看,美国仍处于领先地位。这种"量产在中国、算法在美国"的格局,将在 2026–2028 年经历一场关键的收敛。
全球人形机器人的主要竞争维度对比如下:在模型能力上,美国领先中国约 12–18 个月,但中国具身大模型的迭代速度正在加快,GO-1 和国内学术界的模型成果已经进入可量化的对标窗口。在量产规模上,中国以压倒性优势领先,1.44 万台 vs. 美国估计不超过 5,000 台(主要是特斯拉内部部署)。在融资规模上,Figure AI 9.35 亿美元的单轮融资仍是全球最大,但中国 2025 年全赛道约 200 亿元融资总额意味着更广泛的生态覆盖。在供应链成本上,中国具有最强的成本竞争力,国产化率持续提升使整机成本下降速度明显快于美国竞争对手。
2.2 特斯拉 Optimus:量产最大变量
特斯拉 Optimus 是当前全球最受瞩目的人形机器人项目,也是 2026–2030 年全球竞争格局中最大的单一变量。2023 年 3 月,特斯拉发布 Optimus Gen 1;2024 年底发布 Gen 2,引入无框电机驱动手指(每只手 11 DOF)、踝关节 2-DOF 足部设计(改善步态效率)和基于牛顿物理引擎的仿真训练管线。
FY2025 财报和公开信息显示,特斯拉已在 Fremont 工厂部署约 5,000 台 Optimus 用于内部电池组和整车线束组装验证,全年生产总量约 5,000 台,主要用于特斯拉自身工厂场景验证和模型训练数据收集。特斯拉的核心策略是"先自用后外卖"——将 Optimus 大规模部署在自己的工厂中,同时积累真实工厂操作数据,形成训练飞轮,再以商业化产品面向外部客户。
关键的战略决策体现了特斯拉对 Optimus 的信心:2025 年底,特斯拉宣布停产 Model S 和 Model X(停产时间 Q2 2026),将 Fremont 工厂对应产能转向 Optimus 生产,这是汽车制造史上最大规模的产线从"造车"向"造机器人"的单一转型动作。同时,特斯拉在德克萨斯超级工厂(Gigafactory Texas)新建专用 Optimus 生产线,远期年产能目标 1,000 万台(超激进情景)。
根据马斯克在 2025 年 Q4 财报电话会议和投资者日上的公开声明:2026 年目标在 Fremont 和德克萨斯工厂生产 5–10 万台 Optimus,其中部分面向外部客户交付(首批企业买家预计为汽车和制造业客户);2027 年目标年产量 50–100 万台(乐观情景,取决于关键供应链的产能爬坡);2030 年远期目标 100 万台/年运营中。
Optimus 的核心差异化优势来自两个方面:第一,FSD(全自动驾驶)端到端视觉 AI 技术的迁移能力——特斯拉积累了全球规模最大的真实驾驶视频数据集,其神经网络训练基础设施(Dojo 超算集群)和 Autopilot 团队在视觉感知和端到端控制上有独特优势,将这一能力迁移到机器人操作感知,在理论上可以大幅加速具身智能的数据积累速度;第二,特斯拉在整车量产上积累的供应链管控能力——如何在保持精度的前提下大幅降低制造成本,这是特斯拉在 Model 3 大规模量产过程中磨砺出来的核心能力,有望在 Optimus 量产中发挥关键作用。
2.3 Figure AI:工业应用的先行者
Figure AI 成立于 2022 年,总部位于加州圣何塞,是当前全球工业场景商业落地最深入的人形机器人初创公司。公司获得了包括 OpenAI、微软、英伟达、贝佐斯风险投资基金(BEV)在内的多轮大额融资,总融资额达 9.35 亿美元,估值超过 30 亿美元(2025 年 D 轮)。
Figure 02 是其旗舰商用机型,整机设计以工业可靠性为第一优先级:身高约 167cm,体重约 70kg,承重 25kg,全身 32 DOF(上肢 16 DOF + 手部 16 DOF),采用专为工业环境设计的防护等级机身。
BMW 宝马 Spartanburg 工厂的部署是人形机器人商业史上迄今最重要的里程碑案例之一。详细数据:2024 年启动部署,2025 年全年 Figure 02 在宝马金属冲压工位执行不锈钢板件的抓取和定位任务,共运行约 1,250 小时,完成约 1,250 个 10 小时工作日的等效产出,移动超过 90,000 个零部件,完成约 1,200,000 步行走,支撑了超过 30,000 辆 BMW X3 的生产。这是全球人形机器人历史上第一个超过 1,000 小时、直接参与量产汽车生产且可独立核算产量的商业案例,意义超越了任何此前的演示视频或 POC 报告。
宝马随后将人形机器人项目推广至德国莱比锡工厂,成为欧洲首个正式在工厂生产线上部署人形机器人的汽车主机厂,标志着人形机器人从北美制造业场景向欧洲的扩展迈出了关键一步。
基于 BMW 工厂的实战数据,Figure AI 推出了 Figure 03,核心改进集中在可靠性上:对 Figure 02 的手腕架构进行了彻底重设计,将原先的分布式线缆和分发板(Distribution Board)改为每个手腕电机控制器直连主计算机,彻底消除了 Figure 02 在 BMW 工厂中最高频的故障点(手腕动态电缆摩擦断裂)。Figure 03 同时引入了自研 Helix AI 系统——一个基于 VLA(视觉-语言-动作)架构的端到端操作模型,支持双臂零样本协作任务执行,即机器人可以在没有任务特定示教数据的情况下理解新任务并执行。
2.3b OpenAI 的机器人战略与生态布局
OpenAI 在人形机器人领域的布局虽然低调,但其战略影响深远。作为 Figure AI 和 1X Technologies 的重要股东,OpenAI 通过资本纽带将其大型语言模型能力与具身机器人系统整合,形成了独特的"AI 大脑供应商"角色——OpenAI 不直接制造机器人,而是为被投公司提供 GPT-4V(视觉)、GPT-4o(多模态实时推理)等模型 API,以及 RLHF 训练技术,支撑机器人具身智能的上层推理。
Figure AI 在 2024 年发布的 Figure 01 演示视频中,展示了机器人通过 OpenAI 的多模态 AI 系统理解自然语言指令("我饿了"→ 给人类递香蕉)并实时执行的能力,是当时最令业界震撼的具身 AI 演示之一。尽管这一演示的延时(约 2–3 秒推理延时)在工业量产场景中并不实用(工业场景需要 < 100ms 响应),但它直观展示了大型语言模型与机器人具身控制融合的可能性,推动了业界对 VLA(视觉-语言-动作)架构的广泛关注。
OpenAI 的机器人战略在 2025 年出现了重要进展:公司宣布重建机器人研究团队(此前曾于 2021 年解散),并与多家机器人整机厂签署了 API 合作协议,为其提供实时多模态推理能力作为机器人"云端大脑"的选项之一。这一布局意味着 OpenAI 可能成为未来人形机器人 AI 推理层的主要服务商之一,类似于其在 SaaS 行业中的 API 服务地位。
谷歌 DeepMind 的并行竞争:谷歌 DeepMind 通过其 Gemini 机器人版本、RT-X 开放数据集(包含全球 20+ 家机器人团队的操作演示数据,共约 52,000 条轨迹)和 π0(Pi-Zero)多任务具身模型,构建了与 OpenAI 路线并行的具身 AI 生态。DeepMind 的 π0 模型在 2025 年展示了在 7 种不同机器人上执行超过 70 种任务的能力,是目前覆盖任务多样性最广的具身策略模型。谷歌 DeepMind 的机器人 AI 能力通过 Gemini API 向商业客户开放,与 OpenAI 形成了直接竞争。
2.4 Boston Dynamics:运动控制的标杆
波士顿动力公司(Boston Dynamics)自 2022 年被现代汽车集团全资收购后,持续推进 Atlas 系列的全电动化转型。2024 年,波士顿动力发布了全电动 Atlas(Electric Atlas),放弃了沿用多年的液压驱动架构,改为全电动关节执行器,同时大幅提升了运动速度(奔跑速度超过 4m/s)和全身灵巧性(手部 DOF 提升至 14 DOF)。
2025 年,Electric Atlas 在现代汽车蔚山工厂完成了多项搬运和装配任务的演示验证,展示了在实际汽车工厂环境中的工位交互能力。Boston Dynamics 与现代汽车集团在汽车工厂自动化上的深度协同,是其区别于其他人形机器人企业的独特战略优势——既是最大股东,也是最重要的首发商业客户。
Spot(四足机器人)仍是 Boston Dynamics 的核心营收来源。Spot 在工厂巡检、建筑工地三维扫描、油气设施日常监测等场景已有成熟的商业化部署,累计客户数量超过 1,500 家,为 Boston Dynamics 提供稳定的经常性收入,支撑 Atlas 系列的持续研发投入。
2.5 Agility Robotics:仓储场景先行者
Agility Robotics 的 Digit 是全球首个真正实现商业规模化部署的人形机器人,其仓储优先的设计理念提供了一个重要的商业化路径参照。Digit 的形态是刻意优化的:双腿步行保留了行走能力(区别于 AGV),但手部没有设计人类手指样式的灵巧手,而是配备专为料箱抓取优化的夹持器(Gripper),整机高度约 175cm,工作负载约 16kg(下一代提升至约 23kg)。这一设计取舍揭示了一个重要逻辑:针对场景的定向优化比追求全面仿人更快到达商业化。
2025 年核心里程碑:Digit 在 GXO 物流 Flowery Branch 仓库完成了超过 10 万个料箱的商业化搬运,成为人形机器人历史上第一个可独立核算且超过 10 万次操作的商业规模数据;亚马逊启动 Digit 在其仓储网络中执行空料箱回收任务的测试项目。
Agility 的 RaaS(Robot-as-a-Service,机器人即服务)商业模式在整个人形机器人行业具有示范意义:企业无需购买机器人(避免高额资本支出),只需按实际完成的托盘/箱搬运次数支付服务费,降低了客户决策门槛;对 Agility 而言,RaaS 模式将销售型收入转化为经常性收入,提升了公司估值逻辑的质量。国内智元机器人和宇树科技已开始研究引入类似的订阅制服务模式。
2.6 1X Technologies:数据密度驱动的北欧玩家
1X Technologies(前身 Halodi Robotics),总部位于挪威,是 OpenAI 投资的最主要机器人公司之一。其旗舰产品 Neo Gamma 是一款全尺寸双足人形机器人,专注于家庭服务场景的长期布局。1X 的核心技术主张是"数据密度驱动"(Data Density)——通过在固定数量的示教中最大化任务多样性,构建最高信息密度的训练数据集,而非单纯追求数据量。这一理念与 NVIDIA 用 780,000 条合成轨迹提升 GR00T N1 性能 40% 的实践形成了有趣的对照:质量 vs. 规模,是具身学习数据策略的核心分歧之一。
2025 年,1X 发布了 Neo Beta 商用前测试版本,并在挪威扩建了自有工厂测试站点,用于大规模、多任务、多机器人的同步数据采集。
2.7 Sanctuary AI:精细操作的加拿大路径
Sanctuary AI 是加拿大的头部人形机器人公司,旗舰产品 Phoenix 的技术差异化在于超高 DOF 仿人双手——每只手拥有约 20 DOF,是目前商用机型中最接近人类手部自由度的设计。Sanctuary 的应用定位是零售和制造业中需要精细手部操作的任务(货物分拣、精密组装、实验室操作),避开了与特斯拉和 Figure 直接竞争的汽车重型工位。
2025 年,Sanctuary AI 获得了来自日本和北美汽车零部件厂商的商业订单,完成了在汽车零部件装配场景的多工位验证。
2.8 Apptronik:模块化可靠性工程
Apptronik(孵化自美国德克萨斯大学奥斯汀校区)的 Apollo 机器人是当前工业场景认可度最高的美系商用人形机器人之一,也是 2025 年融资额(9.35 亿美元 A 轮,含梅赛德斯-奔驰 4.03 亿美元战略投资)最高的人形机器人融资事件之一。Apollo 身高约 173cm,体重约 73kg,承重约 25kg,其整机设计的首要优先级是模块化可维护性——关键执行器可现场快速更换(目标换件时间 < 30 分钟),满足 7×24 小时工业连续运营对维护效率的要求。
2025 年,梅赛德斯-奔驰在柏林数字工厂园区(MBDFC)开始测试 Apollo,执行物料配送和轻量级装配任务,是欧洲汽车主机厂中第二个正式引入人形机器人的(BMW 为第一)。梅赛德斯-奔驰成为战略股东后,双方签署了商业部署协议,计划 2027 年实现商业规模交付。Apptronik 还与全球最大的电子制造服务商 Jabil 签署了制造合作协议,以汽车级规模和质量标准量产 Apollo,这一合作将 Apptronik 与专业量产制造伙伴的结合提升到了战略层面。
2.8b 人形机器人领域的跨界玩家与战略投资人
除了专注的整机厂和供应商,人形机器人领域还吸引了来自多个传统行业的跨界玩家通过投资或自研进入这一赛道,这些跨界布局将深刻影响未来的竞争格局:
科技巨头的战略布局:苹果公司虽然尚未公开宣布人形机器人产品,但其在 Vision Pro 空间计算、LiDAR 传感器和神经网络推理芯片(Apple Silicon 的 Neural Engine)上的技术积累,被部分分析师视为切入具身 AI 的潜在底层能力。谷歌(Alphabet)通过 DeepMind 积极参与具身 AI 基础研究(π0、RT-X),并通过 Intrinsic 商业化其工业机器人软件平台,其在机器人领域的整体布局覆盖了从基础研究到商业落地的完整链条。Meta 在具身 AI 研究上相对低调,但其 AR/VR 硬件能力(Quest 系列的传感器和计算平台)与人形机器人感知系统有一定的技术重叠。微软通过 Azure AI 平台和对 OpenAI 的战略投资(持有约 49% 股权)在 AI 大模型层面拥有关键资源,并与多家机器人公司建立了 Azure 云计算合作关系。
汽车企业的投资与自研:除前文提及的现代汽车(收购 Boston Dynamics)和梅赛德斯-奔驰(投资 Apptronik)外,宝马(战略合作 Figure AI,莱比锡工厂部署)、通用汽车(正在评估多家整机厂方案)、大众(评估 Agility Digit)均在不同深度上涉足人形机器人领域,形成了"汽车主机厂+机器人整机厂"的战略合作矩阵。这一矩阵的形成,意味着顶级汽车主机厂已经将人形机器人纳入其未来工厂自动化战略的核心视野,而非仅仅是"技术尝鲜"。
物流与电商巨头的战略布局:亚马逊的 Amazon Robotics 已是全球最大的仓储机器人运营商(部署超过 75 万台各类仓储机器人),通过与 Agility Robotics 的合作将人形机器人纳入其仓储自动化路线图。京东(JD.com)投资智元机器人,并开始在其物流仓库中测试智元远征 A2-W,是国内电商平台中人形机器人部署进展最快的企业。阿里巴巴(战略投资宇树科技)和顺丰(与银河通用机器人 POC 合作)代表了国内另外两个重要的仓储人形机器人早期客户和战略投资人。
2.9 全球人形机器人产业链全景:海外供应商分布
了解海外供应链生态,有助于评估中国整机厂在技术和成本上的独立性边界,以及国产替代的空间和节奏。
美国供应商生态:除整机厂外,美国在关键零部件和软件生态上拥有不可忽视的供应链优势。关节执行器方面,Exlar(Curtiss-Wright 旗下)是行星滚柱丝杠领域的全球主要供应商之一;ATI Industrial Automation 是全球六维力传感器的领导者;Harmonic Drive(哈默纳科美国分公司)在北美市场有直接分销能力。计算平台方面,NVIDIA(Jetson Thor)和高通(Snapdragon 机器人平台)是两大边缘 AI 芯片提供商。软件方面,Intrinsic(谷歌 Alphabet 子公司)和 Covariant(被 Amazon 收购,成为 Amazon Robotics 的 AI 子公司)在机器人 AI 软件层有重要布局。
日本供应商生态:日本是全球工业机器人关键零部件的最重要生产地。哈默纳科(Harmonic Drive,谐波减速器)、纳博特斯克(Nabtesco,RV 减速器)、发那科(Fanuc,伺服电机+数控系统)、安川电机(YASKAWA,伺服电机)、NSK/THK/NTN(精密轴承和丝杠)共同构成了全球机器人精密传动的"日本集群"。这一集群在精度和可靠性上长期保持全球领先,日本政府和产业界也在积极推动传统机器人零部件企业向人形机器人赛道转型,以维持日本在全球机器人产业链中的核心地位。
德国/欧洲供应商生态:舍弗勒(Schaeffler,精密轴承)、博世力士乐(Bosch Rexroth,传动系统)、海德汉(Heidenhain,高精度编码器)、倍福(Beckhoff,实时运动控制器和 EtherCAT 总线)是欧洲在精密传动和运动控制领域的核心供应商,其产品在中国人形机器人整机中的使用比例随国产化提升而逐步下降,但高端规格的进口依存度仍相当高。
国际供应链的"脱钩风险"评估:对于中国人形机器人整机厂而言,最核心的供应链风险不是来自整机(可以完全国产)或大多数零部件(已进入国产化通道),而是:NVIDIA 计算平台(出口管制覆盖 Jetson Thor 对华出口的可能性)、哈默纳科/纳博特斯克高精度减速器(顶级精度规格仍有依赖)和高精度磁编码器(Renishaw、多摩川精机的高端规格产品)。这三类进口依赖均已启动或加速国产化,但完全独立仍需 2–3 年时间。
第三章 政策、宏观与资本环境(PEST 分析)
3.1 政策环境——中国政策体系全面构建
工业和信息化部于 2023 年 11 月印发《人形机器人创新发展指导意见》(以下简称《指导意见》),是中国人形机器人产业政策的顶层设计文件。《指导意见》明确了三阶段目标:到 2025 年初步建立人形机器人创新体系,关键技术("大脑""小脑""肢体")实现突破,核心零部件安全有效供给,整机产品达到国际先进水平,在特种、制造、民生服务等场景实现批量生产,培育 2–3 家具有全球影响力的生态型企业;到 2027 年技术创新能力显著提升,综合实力达到世界先进水平;到 2035 年,人形机器人产业综合实力达到国际先进水平,产品深度融入实体经济和社会生活。
2025 年全年,工信部的政策支持力度进一步加大:在"揭榜挂帅"方向增加了具身大模型和全栈一体化关节模组的重点攻关任务;积极推动建立国家人形机器人标准化技术委员会(计划 2026 年正式设立);2026 年 1 月,工信部宣布将发布《人形机器人与具身智能综合标准化体系建设指南》,系统规范电气安全(IEC 标准适配)、通信协议(时间敏感网络 TSN 在机器人中的应用)、人机交互安全(力控限制和急停机制)、测评方法(场景化 benchmark 体系)等标准维度,为规模化工厂部署提供合规基础。
地方政府政策高度密集:北京亦庄经开区设立 10 亿元人形机器人专项产业基金,已出资银河通用、星动纪元等具身智能企业;上海浦东新区、松江区分别设立专项扶持计划,张江人工智能岛规划"具身智能产业带",智元、傅利叶、宇树上海研发中心相继落户;深圳南山区发布具身智能人形机器人产业扶持政策,宇树华南研发中心获得配套支持;苏州工业园区面向谐波减速器、行星丝杠等零部件企业提供土地和税收优惠,绿的谐波苏州工厂产能扩张获得政策支持。
3.1b 中国人形机器人政策体系的评估:优势与局限
中国人形机器人政策体系的优势在于高度集中的政策资源调配能力和产业方向的快速确立。但这一体系也存在以下局限需要客观评估:
规划目标与市场现实的对齐程度:政府规划目标倾向于乐观设定(如"到 2025 年整机产品达到国际先进水平"),而市场现实中 2025 年底中国人形机器人整机的综合技术水平相比特斯拉 Optimus 在 AI 能力上仍有差距。这种"规划目标与现实差距"的存在,并不意味着政策失败,而是反映了在快速演进的技术领域,规划目标更多起到"灯塔"而非"精确预测"的作用。
政策支持的方向失衡问题:当前政策资源的分配在整机研发支持(各地政府竞相以招商优惠和产业资金吸引整机厂落地)和基础研究支持(具身大模型、物理引擎、仿真平台的基础研究)之间存在不均衡——整机端支持充分,基础研究端的持续投入仍有提升空间。对于一个高度依赖技术突破的行业,适度加强基础研究侧的投入将对产业长期竞争力有更深远的影响。
标准化工作的滞后问题:人形机器人安全标准(机器人与人类的安全距离、力矩限制、通信安全等)和测评体系(场景化 benchmark,如"汽车工厂 10 小时连续运行测试"等)的缺失,是阻碍工厂客户大规模采购决策的重要因素。工信部 2026 年拟发布的《人形机器人与具身智能综合标准化体系建设指南》是重要的政策进步,但从指南发布到相关标准的具体化和强制执行,还需要 2–3 年时间。
数据安全合规的多重约束:人形机器人在工厂采集的视频、传感器和操作数据,同时受到《数据安全法》、《个人信息保护法》和行业数据分类保护规定的约束。在具身 AI 训练依赖大规模真实操作数据的技术背景下,如何在合规框架下建立数据飞轮机制,是整机厂需要解决的重要合规工程问题。
3.2 政策环境——国际政策动态
美国方面:拜登政府末期与特朗普政府初期延续了对中国半导体和 AI 算力芯片的出口管制,涵盖 NVIDIA H100/H800、A100/A800 及 Blackwell B100/B200 系列对华出口限制。这一限制直接影响了中国人形机器人企业在具身大模型训练基础设施上的投入路径,是当前中美具身大模型能力差距的结构性原因之一。但美国政府同时高度重视国内机器人产业竞争力,DARPA(先进研究项目局)持续资助双足机器人运动控制和具身 AI 基础研究,能源部国家实验室(NREL、ORNL)开展智能制造场景的机器人应用研究。
欧盟方面:《人工智能法案》(AI Act)于 2024 年正式生效,将工业环境中的协作机器人 AI 系统列为"高风险 AI",要求满足透明度、可解释性、人工干预机制和安全认证等合规要求。在工厂部署人形机器人的欧洲企业需确保机器人 AI 系统符合 CE 标志和 AI Act 相关合规要求,短期增加了欧洲市场的合规成本,但也为构建欧洲本土机器人 AI 合规认证体系提供了先发机会。欧盟同时推出了 Horizon Europe 框架下的机器人制造应用专项资金,支持欧洲本土人形机器人技术的研发和产业化。
日本方面:日本作为全球最重要的工业机器人大国(发那科、安川、三菱等),面对人形机器人新浪潮的态度是积极融合——发那科(Fanuc)和安川电机(YASKAWA)均已将具身智能技术纳入其协作机器人的下一代研发路线图,三菱电机与多家人形机器人初创企业建立了技术合作。日本丰田 T-HR3 和本田 ASIMO 的研究积累也为日本学术界和产业界提供了深厚的机器人基础知识库。
3.3 经济环境
制造业用工成本上升是推动人形机器人替代需求的根本经济驱动力。中国制造业平均工资 2015–2025 年年均增长约 7–9%,其中汽车、电子等高技能制造业领域的用工成本增幅更加显著。以一个汽车总装工人为例,包含五险一金在内的综合用工成本约 12–18 万元/年,夜班、高温工位和特殊工种存在约 30–50% 的额外补贴;以一个电子制造企业的 SMT 工程师为例,综合用工成本约 10–15 万元/年。
当前中国主流工业人形机器人的整机定价约 30–65 万元(2025 年),叠加系统集成费用(约 5–15 万元)和年维护成本(约 3–8 万元),全生命周期(5 年)总拥有成本约为 40–100 万元。以 5 年期摊销计算,年均成本约 8–20 万元,已经接近中高薪制造业岗位的用工成本区间。当价格降至 20–30 万元区间(预计 2026–2027 年),ROI 回收期将压缩至 1.5–2.5 年,届时经济账将驱动工厂采购决策进入加速通道。
一级市场融资高度活跃:2025 年,中国人形机器人赛道一级市场融资总额约 200 亿元,创历史新高。主要融资事件包括:智元机器人完成多轮融资(含高盛投资和京东投资),估值超 150 亿元;宇树科技科创板 IPO 于 2026 年 3 月获受理,拟募资 42 亿元,估值约 420 亿元;傅利叶智能完成超 10 亿元 C 轮融资;银河通用机器人完成超过 7 亿元融资;逐际动力(LimX Dynamics)、星动纪元(Robot Era)、众擎机器人等均完成新一轮融资。
全球供应链重构为人形机器人供应链提供了结构性窗口。随着更多制造业客户开始验证人形机器人的实际产线效能,系统集成商和零部件企业的商业模式正从"一次性项目"向"规模化产品+长期服务"转变,为供应链企业带来可预测的长周期订单,大幅改善了零部件厂商的融资和产能规划能力。
3.2b 美国国内政策对人形机器人产业的推动
与广泛认知中"美国政府只限制中国 AI 发展"不同,美国政府同时在积极推动本国人形机器人产业的发展,形成了"对内激励+对外管制"的双轨政策格局。
拜登政府末期与特朗普政府初期的延续性:在人形机器人和先进制造领域,两届政府呈现出政策延续性——均支持"制造业回流"(Reshoring)和"先进制造业投资"(Advanced Manufacturing Investment)。《CHIPS 和科学法案》(2022)虽然主要针对半导体,但其配套的"国家科学基金会区域创新引擎"(NSF Regional Innovation Engines)项目中,多个中标项目包含机器人和先进制造业内容,间接支持了人形机器人基础研究。
国防先进研究项目局(DARPA)的持续投入:DARPA 的机器人项目(如 OFFSET 城市行动无人系统、RACER 无人驾驶野外机动)虽然以军事应用为优先,但其资助的技术(特别是腿足机器人运动控制和快速任务适应)与民用人形机器人高度重叠。Boston Dynamics 的多个核心技术最初均来自 DARPA 资助的学术研究。
美国国家标准与技术研究院(NIST)的机器人测评工作:NIST 正在推进专门针对人形机器人的性能测评标准化工作,包括:移动性能(行走速度、平衡鲁棒性、爬坡能力)、操作性能(抓取成功率、力控精度)和人机协作安全(力矩限制验证、急停响应时间)等维度的量化测评方法。NIST 标准在全球范围内具有重要的参照价值,其成熟将推动美国机器人产品在全球市场的合规认证效率。
3.3b 一带一路与全球南方的政策机遇
中国人形机器人产业的政策机遇不仅局限于国内,"一带一路"共建国家的制造业升级需求同样是重要的政策视角。在东南亚(越南、泰国、印尼)、南亚(印度、孟加拉国)和中东(沙特、阿联酋制造业多元化战略),制造业正在经历快速扩张,但本土劳动力成本也在快速上升,对工厂自动化的需求日益迫切。
沙特阿拉伯是一带一路沿线国家中对人形机器人兴趣最强的市场之一:2025 年,沙特阿美和沙特基础工业公司(SABIC)均宣布探索工业机器人(包括人形机器人)在石化和采矿场景的试验项目;沙特阿拉伯 NEOM 新城项目(2030 年前完成)将工业机器人纳入其未来城市基础设施规划。中国整机厂(以宇树为代表)正积极进入中东市场,依托中沙两国的战略合作关系,为中国人形机器人出口提供政策便利。
越南是东南亚制造业升级最典型的代表:三星、LG、富士康的越南工厂已成为全球重要的 3C 制造基地,越南制造业工人的年均工资约 3,000–5,000 美元,随着劳动力成本上升,越南制造业对工厂自动化的需求正在加速。中国制造的人形机器人(如宇树 H2、众擎 PM01)在价格上对越南等东南亚市场具有天然优势。
3.4 社会环境
劳动力结构性短缺是推动人形机器人需求的长期社会因素,且这一因素的驱动力将随时间推移持续增强。中国劳动年龄人口(15–64 岁)自 2013 年达峰后持续下降,预计到 2035 年将比 2020 年减少约 7,000 万人,其中适合制造业的青壮年劳动力(16–35 岁)减少更为显著。制造业"招工难"在珠三角、长三角已成结构性常态,部分高温、高噪、有毒有害的工位招聘难度尤为突出,这为人形机器人的场景定向替代提供了最具吸引力的入口。
安全和伦理边界是制约人形机器人大规模部署的关键社会因素。当前在工厂场景的部署普遍采用"人机物理隔离"或"协作区速度/力矩限制"设计,机器人与人类工人保持安全距离或限速运行。ISO/TS 15066(协作机器人安全规范)和 IEC 62443(工业网络安全)是当前商业部署的主要参考标准,但这些标准是为传统工业机械臂制定的,尚未系统覆盖高自主度人形机器人的场景。
公众认知与接受度:在工厂场景,生产线工人对人形机器人的关注核心是"是否会被取代"。企业层面普遍采用"替代危险枯燥岗位、工人转岗技能提升"的沟通策略,部分企业(如优必选的车厂合作)承诺为现有工人提供人形机器人协同技能培训。
3.4b 劳动力市场变革与社会保障政策的互动
人形机器人大规模替代制造业工人,将在 2027–2030 年逐步触发一系列社会保障政策调整需求。以下是可以预见的政策互动方向:
职业再培训政策:中国政府已将制造业工人技能培训纳入重点政策议程("十四五"技能中国行动),人形机器人替代浪潮将加速对"人机协作技能"(操控和维护机器人的能力)的职业培训需求。高职院校和技工学校将逐步引入人形机器人操控和维护课程,形成新的职业资质体系。
失业保险与社保调整:若人形机器人替代速度超过劳动力转移速度,可能产生结构性失业压力(特别是在制造业集中的珠三角和长三角),倒逼失业保险金提取期限延长和再培训补贴政策出台。这一政策反馈回路将是 2028–2030 年制造业数字化政策的重要议题。
机器人税讨论:在全球范围内(比尔·盖茨等人曾提出"机器人税"概念),部分国家和地区正在探索对企业使用机器人替代人工征收"机器人税",将收益的一部分用于支持失业工人再就业。中国目前没有这一政策方向,但随着替代规模扩大,这一讨论可能在 2030 年前后进入政策视野。
3.5 技术环境
具身智能大模型的爆发是当前技术环境中最重要的单一变量,NVIDIA Isaac GR00T N1 的发布(2025 年 3 月)标志着具身 AI 正式进入"开放生态"阶段。此前,具身 AI 基础模型主要由 Google DeepMind(RT-2、RT-X)、斯坦福(ACT/Diffusion Policy)等学术机构推动,各整机厂各自为战。GR00T N1 的开源为整个生态提供了共同的技术底座,使中小型整机厂和科研团队能够基于 GR00T 开发垂直场景应用,而无需从头训练基础模型。NVIDIA 提供的合成数据生成工具(Cosmos 世界模型)进一步降低了数据壁垒,780,000 条合成轨迹在 11 小时内生成的效率(等效 6,500 小时真实示教数据),彻底改变了具身 AI 训练的数据经济学。
计算基础设施的新一代突破提供了关键算力支撑:NVIDIA Blackwell 架构 GPU(B100/B200/GB200)在变换器推理上较 H100 提升约 5×,显著降低了具身大模型推理的单次成本;Jetson Thor(800 TOPS)和 Jetson Orin(275 TOPS)为边缘侧推理提供了高密度算力方案;国产算力方向,华为昇腾 910C 在部分国内科研机构的具身模型训练任务中已开始部署,性能与 NVIDIA 差距在持续缩小。
仿真技术的进步显著降低了真实数据的依赖程度:NVIDIA Isaac Sim(基于 Omniverse)、MIT 的 Genesis(高速 GPU 并行仿真,比 MuJoCo 快约 430,000 倍)和 Google DeepMind 的 MuJoCo 生态为具身 AI 提供了高保真训练环境,而 Sim-to-Real(仿真到真实)的迁移难度也随着高保真物理引擎的进步持续降低。
第四章 中国市场规模与价格曲线
4.1 2025 年市场规模与结构
2025 年是中国人形机器人产业从"样机展示年"向"量产元年"的关键跨越之年。从核心数字来看:全年中国人形机器人整机出货量约 1.44 万台,同比增长数倍,占全球总出货量约 84.7%,市场规模约 15.5 亿元人民币,中国单一市场已占全球的 53.8%。
从出货结构分析:工业制造场景是最大应用终端,约占出货量 55%,以汽车工厂、电子制造为主要落地场所;科研和技术验证采购约占 25%,包含国内外高校采购(宇树 G1 是高校首选平台)和企业自用研发验证;商业服务场景约占 12%,包括博物馆、酒店、展览中心等;物流仓储场景约占 8%,该场景 2026–2027 年的增速预计将高于工业场景。
从整机品牌竞争格局看,中国企业垄断了前五名:宇树科技全球市占率约 32.4%(中国出货量约 5,500 台),智元机器人累计量产超 5,000 台(三条产品线并行),优必选意向订单超 500 台并斩获 2.5 亿元大单,傅利叶智能 GR-1 进入千台级量产准备,众擎机器人 PM01 以 8.8 万元极低价格扩大开发者生态。
宇树科技在量产速度上的领先有其独特原因:宇树从四足机器人起家,在运动控制算法(特别是全身动力学控制和平衡算法)和量产工艺上积累了比多数竞争对手更早的工程经验;同时,G1 的 9.9 万元定价大幅扩大了研发者生态的规模,形成了"研发者用宇树→研究成果在宇树平台上验证→宇树获得更多算法反馈"的生态正反馈。
4.2 2026 年展望:量产元年的真正考验
2026 年是真正意义上的量产元年——不是出货量的象征性突破,而是量产交付体系的系统考验。据 TrendForce 预测,2026 年国内人形机器人出货量约 6.25 万台,同比增长约 94%。
推动出货量高速增长的供给端核心驱动力:宇树科技 2026 年年产能规划达 7.5 万台(杭州新工厂开始产能爬坡);智元机器人 2026 年计划出货数万台,远征 A2 和灵犀 X1 并行量产;优必选 Walker S1 已具备规模化交付条件,产能目标万台级;傅利叶智能 GR-1 产能扩充至千台级,聚焦医疗康复和工业双赛道;众擎机器人 PM01 整机售价 8.8 万元起,定位开发者和服务场景,2026 年加速出货;2026 年多家新品集中量产,包括宇树 H2 正式版、智元远征 A3 前瞻版和多家初创企业的首款商用产品。
需求端核心驱动力:国内汽车主机厂和 EV 工厂(比亚迪、吉利、极氪、北汽)将加大人形机器人采购预算——优必选已获 2.5 亿元单笔订单的落地验证打通了主机厂采购流程;3C 电子制造厂商启动系统性工位评估和小批量采购;政府机构科研采购和高校实验室需求持续增长;海外出口窗口逐步打开,宇树 H1/H2 对美国、日本、欧洲市场的出口量正在增长;物流仓储场景(JD.com、顺丰、菜鸟等)开始启动批量采购。
4.2b 2026 年量产元年的关键验证指标
2026 年的市场发展不仅取决于出货量数字,更取决于几个关键质量指标的验证,这些指标将决定 2027–2028 年的市场爆发是否按预期到来:
MTBF 实测突破 1,500 小时:工业整机的平均故障间隔时间能否在 2026 年批量交付机型上实现 1,500 小时(约 6 个月单班运行)的稳定记录,是最重要的单一质量验证指标。目前仅 Figure 02 有超过 1,250 小时的商业部署记录,宇树 H1/H2 的量产批次是否能达到 1,500 小时需要 2026 全年的实际运营数据来验证。若 2026 年底能出现 3 家以上整机厂的量产机型同时达到这一水准,将触发大量处于观望状态的工厂客户进入采购决策。
单工位 ROI 回收期压缩至 2 年以内:整机售价降至 25 万元以下(预计 2026 年下半年部分机型实现),叠加系统集成费用和年维护成本,总拥有成本约 35–50 万元/5 年,对应年均成本约 7–10 万元,已接近或低于中级制造业岗位的人工综合成本,ROI 窗口开始清晰。
至少 1 家整机厂实现超过 1,000 台的单季度交付:这一数字标志着量产体系(供应链管理、生产组织、出厂标定、交付物流)的真正成熟,是从"小批量交付"到"大规模量产"的临界点。宇树 2026 年 7.5 万台产能目标意味着每季度交付约 18,000 台,若能实现将远超这一门槛;优必选和智元的目标是在 2026 年达到季度交付超千台的能力。
跨工位迁移时间缩短至 3 天以内:当新工位的示教 + 调试时间从当前的 2–3 周缩短至 3 天以内,人形机器人的经济账将对中小型制造企业打开。这一突破需要具身大模型泛化能力的提升和自动化工位分析工具(AI 辅助的任务拆解和工位适配建议)的成熟。2026 年能否出现这一突破,是决定 2027 年需求增速是否加速的关键。
4.3 中期预测(2027–2030 年)
2027–2030 年是人形机器人从"量产元年"进入"规模商业化"的关键窗口期,出货量曲线预计将呈现出典型的 S 型增长早期阶段特征:
2027 年:中国出货量预计 15–20 万台,全球出货量预计 20–30 万台。特斯拉 Optimus 开始面向外部客户批量交付(目标 5–10 万台),市场集中度从 2025 年的 CR5 约 70% 进一步提升。整体市场竞争格局趋于集中,无法进入工厂场景量产的整机厂将面临资本与客户的双重压力。
2028 年:中国出货量预计 30–50 万台,主流工业机型单台价格有望降至 15–20 万元,ROI 回收期压缩至 1–1.5 年,触发第二轮需求加速(中型制造企业开始采购)。家庭服务场景在日本、韩国出现早期商业化案例,中国家庭场景仍以高端消费者的早期采购者(Early Adopter)为主。
2030 年:全球出货量目标 100–120 万台(IDC、高盛等机构预测区间均值);中国市场规模有望达到约 8,700 亿元(中国电子学会高情景预测,含下游应用服务生态);中国出货量占全球比例约 85%;全球 CR3 集中度约 60%(宇树/特斯拉/智元预计位居前三)。
4.4 价格曲线详细拆解
人形机器人的价格下探机制与消费电子有显著不同:消费电子依靠芯片工艺迭代(摩尔定律)驱动成本下降,而人形机器人依靠的是零部件国产化规模效应 × 产量规模化摊薄 × 设计简化迭代三重机制叠加。
2024 年基准水平:全尺寸工业级人形机器人整机定价 80–120 万元,客户群体极度集中(特斯拉、BMW、通用汽车等大型科技和汽车企业),商业模式以"机器人即高端研发项目"为主。
2025 年显著下探:全尺寸工业级整机降至 30–65 万元区间,是 2024 年的 40%–55%,降幅达到历史最大单年跌幅。宇树 H1 约 65 万元;优必选 Walker S1 目标价格低于 30 万元;宇树 G1 9.9 万元(中尺寸);众擎 PM01 8.8 万元(服务/开发者定位)。整机成本下降来源:谐波减速器从 2,400 元/套(进口)降至约 1,320 元/套(绿的谐波国产),降幅约 45%;无框电机国产化率提升至约 70%,均价下降约 30%;结构件国产碳纤维应用扩大,成本下降约 20%;规模效应:千台级量产摊薄工装治具成本约 15%。
2026–2027 年预测:目标区间 18–30 万元。核心驱动:行星滚柱丝杠国产量产在即(贝斯特、恒立液压 2026 年推进),将把线驱腿部执行器成本压缩 30–50%;灵巧手国产化率提升(更多供应商进入市场);出货量突破万台级别,生产学习曲线效应(每产量翻倍成本下降约 10–15%)显现。
2028–2030 年预测:工业机型目标区间 10–15 万元,家庭机型高度不确定但目标 5–8 万元。主要不确定性:六维力传感器和高精度触觉传感器的国产化节奏(当前国产化率不足 40%);单位产量进一步下降是否会受到整机厂盈利诉求的制约(ROI 与规模化之间的平衡)。
4.5 产业链投资热度与资本市场
人形机器人赛道在资本市场的热度不仅体现在一级市场融资,也深刻反映在 A 股和港股的二级市场表现上。
A 股人形机器人概念板块:2024 年下半年至 2025 年全年,A 股人形机器人概念板块整体涨幅显著,涉及整机、减速器、丝杠、无框电机、传感器、电池和结构件的相关上市公司普遍出现了估值重估。绿的谐波(688017)、贝斯特(300580)、汇川技术(300124)、步科股份(603160)、雷赛智能(002979)、双环传动(002472)均成为机构投资者重点关注的人形机器人供应链标的。这一主题投资热度在 2025 年前三季度持续,尽管部分个股的静态 PE 已高达 80–200 倍,远超其当期盈利能力,更多反映的是市场对 2027–2030 年量产场景下业绩释放的预期。
港股优必选(9880)的估值逻辑:优必选作为全球首家在港交所上市的人形机器人整机厂,其股价自 2023 年上市至 2025 年初经历了大幅波动(从高峰跌至约 20–30 港元区间),但在 2025 年 Walker S1 汽车工厂实训取得突破性进展后,股价重获资本关注,反弹至约 50–80 港元区间。优必选的港股估值逻辑是:工业人形机器人商业化路径最清晰的整机厂(多家车厂在产线实训数据支撑),2.5 亿元大单证明了采购规模化的可行性,但盈利时间节点仍是估值压制的核心因素。
宇树科技 IPO 定价与市场影响:宇树科技以约 420 亿元估值申报科创板,参照 2025 年营收 16.99 亿元,对应 EV/Revenue 约 25×,在人形机器人行业属于相对合理的定价(考虑到净利润 5.9 亿元,PE 约 71×)。宇树 IPO 的成功(若顺利上市)将成为中国人形机器人行业的历史性资本市场里程碑,为整个赛道的后续 IPO(智元、傅利叶等)提供估值锚点,同时为宇树提供 42 亿元募资用于产能扩张和研发投入。
风险资本的集中度问题:中国人形机器人赛道的 200 亿元融资中,约 60% 集中在宇树(预 IPO 估值)、智元(约 150 亿元估值)和优必选(港股市值)三家头部公司,剩余 40% 分散于 20+ 家中小整机厂和零部件厂商。这种集中度反映了资本对"赢家通吃"预期的押注,但也意味着行业内的竞争最终将聚焦于少数几家具有量产能力的头部企业。
4.6 人形机器人的下游客户类型与采购决策机制
理解人形机器人的下游客户类型和采购决策机制,对于评估 2026–2028 年市场放量节奏至关重要。不同类型客户的采购决策周期、决策标准和付款方式差异显著,直接影响整机厂的销售周期和现金流模式。
汽车主机厂(OEM):汽车主机厂是 2025–2026 年最重要的首发商业客户群体,以比亚迪、吉利、极氪、蔚来为代表。汽车主机厂的采购决策流程标准化程度高(采购委员会审批、供应商认证、POC 验证、小批量试用、大批量采购),通常需要 12–18 个月完成从 POC 到首批批量采购的全流程。主机厂对供应商的要求包括:可靠性记录(MTBF 数据)、质量管理体系(IATF 16949 汽车质量标准,人形机器人整机厂正在推进认证)、应急备件响应(4 小时内到场维修)和批量供货能力(年供货量 ≥ 100 台)。优必选 2.5 亿元大单的达成,标志着中国整机厂已经具备通过主机厂完整采购流程的能力。
汽车零部件 Tier 1 供应商:博世、采埃孚、法雷奥等国际 Tier 1 和宁德时代、华为车 BU、均胜电子等国内 Tier 1 的工厂自动化需求与主机厂类似,但采购决策周期通常更快(6–12 个月)、单次采购量较小(20–50 台),是 2026–2027 年批量订单的重要增量来源。
电子制造服务商(EMS):富士康(Foxconn)、立讯精密、华勤技术等大型 EMS 厂商对工业机器人的需求体量巨大,一家大型 EMS 厂商在单一工厂的工业自动化投入每年可达数亿元。EMS 厂商的核心决策标准是:单台机器人的 ROI 回收期(目标 ≤ 2 年)、换型时间(切换不同产品型号的适配时间)和综合良率影响(机器人是否会引入新的不良品)。3C 制造场景对灵巧手和精密视觉的要求最高,这也是 EMS 厂商在等待具身大模型泛化突破后才会大规模采购的主要原因。
物流仓储运营商:京东物流、顺丰速运、菜鸟网络等国内头部快递和仓储企业,以及亚马逊、GXO 等全球物流巨头,是仓储型人形机器人的主要客户。这类客户通常以 RaaS 模式为首选,因为物流仓储的人力成本可以精确量化(每托盘搬运成本约 0.3–1 元),与机器人 RaaS 定价的对标极为清晰。物流客户的采购决策周期约 6–9 个月,通常优先在自营旗舰仓进行试点,验证 KPI 后快速向全网络复制。
高校和研究机构:全球超过 300 所高校和企业研究院购买了宇树 H1/G1 用于具身 AI 算法研究,这类客户的单次采购量小(1–5 台),但数量多(全球数百家)、决策快(无需长期 POC)、口碑效应强(学术界的评测结果影响行业技术认知)。宇树 G1 9.9 万元的定价直接针对这一群体,将采购门槛降至高校科研经费的可覆盖范围。
政府和公共机构:消防、搜救、军事等特殊场景的政府采购是人形机器人一个被低估的市场方向。中国应急管理部、军委科学技术委员会等机构对具备特殊环境(高温、高放射、化学污染)工作能力的双足机器人有明确的战略需求。这类场景对机器人的极限可靠性要求最高,但采购价格接受度也最高,是人形机器人在主流工厂场景之外的重要战略价值场景。
4.7 区域市场分布
在中国国内,人形机器人需求高度集中于三大区域:珠三角(深圳/广州/东莞)是 3C 电子元器件和新能源汽车工厂密度最高的区域,预计 2026 年将成为最大单一需求市场,整机需求约占全国 35%;长三角(上海/苏州/杭州/宁波)是汽车和精密制造需求最集中的区域,同时是整机和零部件研发制造的聚集地,约占全国需求 30%;京津冀(北京/天津)政策驱动的科研和高校采购是主力,约占全国需求 20%。其余地区(西部、东北、中部)合计约占 15%,主要以政府科研采购和工业试点项目为主。
第五章 产业链深度拆解
5.1 关节执行器:整机成本的核心杠杆
关节执行器是人形机器人整机中成本占比最高、技术壁垒最强的零部件系统,通常占整机 BOM 成本的 35%–50%。一台全尺寸人形机器人(如宇树 H1)拥有约 40–60 个执行器自由度,每个关节由三部分构成:驱动电机(产生原始力矩)、减速机构(谐波/RV 减速器或行星滚柱丝杠)和位置/力矩传感器(实现精确控制反馈)。关节执行器的性能直接决定机器人的承载能力、运动速度、控制精度和运动效率(能耗/机械效率比)。
谐波减速器市场详析
谐波传动的原理是利用柔性齿轮(柔轮)的弹性变形实现大减速比,具有体积紧凑(比同等减速比 RV 减速器轻约 30–50%)、传动精度高(传动误差通常小于 1 弧分,即 < 0.017°)、单级可实现 50:1–160:1 的大减速比、无金属接触噪声的优点,是人形机器人中应用频率最高的减速器类型,通常用于腕关节、肘关节、肩关节等空间有限、精度要求高、力矩需求适中的关节。
全球谐波减速器市场长期由日本哈默纳科(Harmonic Drive,海德汉集团旗下)主导,其产品精度和可靠性至今仍是全球基准标准,进口产品报价约 2,400–5,000 元/套(按规格)。中国国产谐波减速器在精度上已基本追上进口产品的主流规格段,价格具有显著优势。
国产龙头苏州绿的谐波传动科技股份有限公司(688017)的核心竞争力数据:FY2025 全年营收 5.71 亿元,同比增长 47.31%;归母净利润 1.24 亿元,同比翻倍;谐波减速器年销量 42.52 万套,同比增长 72.48%;产品报价约 1,320 元/套,较哈默纳科低 55–60%;为宇树科技提供的谐波减速器占宇树总需求的 63%;为智元远征 A2 系列的髋腰关节独家供应行星减速器,2025 年获 5 万套订单。绿的谐波是中国目前唯一同时量产谐波、RV 和行星三种减速器的上市企业,拥有应对不同关节需求的完整产品矩阵,竞争壁垒显著。
RV 减速器市场
RV 减速器采用摆线针轮传动原理,承载能力大(同规格下承载力矩约为谐波减速器的 2–3 倍)、抗冲击能力强、刚性好,适合髋部、膝部、踝部等高负载关节。全球 RV 减速器市场由日本纳博特斯克(Nabtesco)主导(全球工业机器人 RV 减速器市场份额约 60%),其次是日本住友(Sumitomo)。
国内代表性上市企业:双环传动(002472)是工业机器人 RV 减速器的国内龙头,随着人形机器人市场兴起,2025 年 RV 减速器的人形机器人应用营收开始显著增长;中大力德(002896)是另一家具备一定量产能力的 RV 减速器国产企业。
行星滚柱丝杠
行星滚柱丝杠是人形机器人腿部线性关节的关键传动元件,将旋转运动高效转化为直线力(承载能力比同规格滚珠丝杠高 3–5 倍),是特斯拉 Optimus 和 Figure 02/03 等采用线驱腿部设计机型的核心零部件,单台人形机器人通常需要 6–14 根,单价约 8,000–30,000 元,是当前整机国产化率最低的单一关键零部件(估计进口依存度超过 85%)。
国内进展最快的企业:贝斯特(300580)旗下宇华精机已完成反向行星滚柱丝杠样品研发,2025 年已进入客户认证阶段,计划 2026 年实现批量供货;恒立液压(601100)宣布行星滚柱丝杠开发进入产品化阶段;秦川机床(000837)凭借磨齿机领域的精密加工能力,在精密滚柱丝杠方向有布局。如果这三家企业能在 2026–2027 年实现批量量产,将是整机成本下降幅度最大的单一事件。
5.2 无框力矩电机与伺服驱动
无框力矩电机(Frameless Torque Motor)专为关节执行器集成设计,没有外壳和独立轴承,直接嵌入机器人关节结构,通过定子定制绕组产生高力矩密度输出。其技术特点是:最大力矩密度约为同类有外壳电机的 1.5–2 倍(单位重量力矩更大);反向驱动性好(外力可以自由带动关节运动,对于安全的人机协作至关重要);响应带宽高(适合高频力控应用)。宇树 H1/H2 的部分旋转关节采用自研无框电机方案,配合定制谐波减速器,实现了优秀的关节力矩密度和重量指标。
汇川技术(300124,苏州汇川技术有限公司)是国内最大的伺服驱动和运动控制上市企业。2024 年中国伺服电机市场国产化率约 51%,汇川以约 27.6% 的市场份额居国内第一(远超第二名)。汇川 2025 年积极布局人形机器人关节模组,推出面向人形机器人一体化关节(集成电机+驱动器+编码器+谐波减速器的紧凑关节模组)的产品系列,已与宇树、智元等整机厂建立合作评估关系。
步科股份(603160,步科股份)的产品覆盖伺服电机、交流伺服驱动器和直驱力矩电机,已有多款产品进入人形机器人整机厂供应链,在小力矩精密关节(手指、腕部)方向有差异化竞争优势。
雷赛智能(002979)专注于运动控制器、轴驱动模块和伺服系统,为人形机器人多轴同步运动控制提供控制器方案,在多关节协同控制(全身动力学控制所需的实时多轴插补)领域有积累。
三花智控(特指上市公司三花汽零,003137,及其关联企业)已被确认为特斯拉 Optimus 热管理执行器和部分运动执行器的核心供应商之一。三花在汽车热管理领域积累的精密流体控制和微型执行器制造能力,天然适合人形机器人关节液冷和热管理系统的需求,这一优势使三花成为少数能同时服务汽车和机器人两大增量赛道的供应链上市公司。
5.3 六维力传感器与触觉感知
六维力/力矩传感器(6-DOF Force/Torque Sensor)是人形机器人末端执行器控制的核心感知元件,安装于手腕关节处,同时测量三个轴向的力(Fx、Fy、Fz)和三个轴向的力矩(Tx、Ty、Tz),为抓取控制提供毫秒级的接触力反馈,使机器人能够感知和调节操作力,避免损坏工件或伤害人类。在没有六维力传感器的情况下,机器人的抓取操作本质上是"盲力控制"——只能依靠预设力矩阈值,无法实时适应物体的形状变化和接触不确定性。
高端六维力传感器长期由 ATI Industrial Automation(美国,全球市场占有率约 40%)和 Kistler(瑞士)主导,进口产品报价约 15,000–50,000 元/只(按量程和精度规格)。国内代表企业:坤维科技(深圳)主要服务机器人研究机构和整机厂,精度已达到进口产品 90% 水平;宇立仪器(哈尔滨)在航天和重工业六维力传感器有传统积累;鑫精诚(上海)产品已进入多家国内整机厂供应链;柯力传感(603662)是国内称重传感器行业的上市龙头,在六维力方向有战略布局,但量产化程度尚待提升。
触觉传感器(Tactile Sensor)是灵巧手精细操作的关键感知手段,能够测量手指接触面的法向力分布(Normal Force Distribution)和切向摩擦力(Tangential Friction)。触觉传感器对于以下操作场景至关重要:抓取圆柱体零件(防滑落需实时监测切向力);操作柔性材料(布料、塑料膜需精细力度控制);多指协调操作(拧瓶盖、操作门把手等)。目前触觉传感器仍是人形机器人感知系统中工程成熟度最低的环节,主流量产方案的传感单元密度约为 50–500 points/cm²,与人类指尖的约 2,500 points/cm² 仍有差距。
视觉与深度感知方面,奥比中光(9069.HK)是国内最大的结构光深度相机供应商,产品广泛用于宇树 H1/H2 的头部视觉系统(Astra 系列)和智元远征 A2 的近场视觉;速腾聚创(2498.HK)和禾赛科技(HSAI.US)的固态激光雷达被部分整机厂用于室外环境建图和全局导航定位。
5.4 具身大模型与 AI 计算平台
NVIDIA Isaac GR00T 平台是目前全球影响力最大的具身智能开发生态。Isaac GR00T N1 于 2025 年 3 月 18 日在 GTC 大会发布,是全球第一个面向人形机器人的开源通用基础模型。技术细节:多模态输入(语言 + RGB 图像 + 深度信息);双流(Dual-System)架构:System 2(慢思考流,基于大型语言模型,负责任务分解和目标理解)+ System 1(快动作流,基于专门化动作网络,负责低延时运动策略输出);通过模仿学习(Imitation Learning)和强化学习(Reinforcement Learning)联合训练,780,000 条合成轨迹(Isaac Sim 生成,11 小时)辅助真实数据训练,将实际操作性能提升 40%;Newton 开源物理引擎(与 Google DeepMind 和 Disney Research 联合开发)为高保真仿真提供物理底座。
Isaac GR00T N1.5 和 N2 版本已在 2025 年下半年相继发布,迭代方向主要集中在开放世界泛化能力(处理未见过的物体和场景)和双臂协调操作能力的提升。国内主流人形机器人机型(宇树 H1/H2、智元远征 A2、傅利叶 GR-1)均已完成 Isaac GR00T 适配框架的接入,形成了基于同一基础模型的国际化算法生态。
NVIDIA Jetson Thor 是专为机器人设计的边缘计算 SoC,提供 800 TOPS(万亿次操作/秒)的 AI 算力,采用 Blackwell GPU + ARM CPU 异构架构,功耗约 60–100W,是全尺寸人形机器人计算平台的主流选择。Jetson Thor 的发布将人形机器人本体的边缘 AI 推理能力提升了约 3×,使更复杂的具身大模型(参数量 1B–7B 级别)能够在机器人本体上实时运行,无需依赖云端推理。
Figure Helix 是 Figure AI 自研的具身 AI 系统,基于视觉-语言-动作(VLA)模型架构,接受自然语言指令("请把左边第二个螺栓放入右侧托盘"),实时生成双臂协作动作序列。Helix 的核心技术突破是:在 BMW 工厂的商业部署中实现了连续 10 小时工作、小于 1% 的任务失败率(对应操作任务复杂度),以及在有限示教数据下(< 50 次)快速适应新工位的能力。
智元 GO-1 是智元机器人的自研具身大模型,采用多任务端到端学习架构,支持从少量示教数据(50–200 次演示)快速泛化,并支持多台机器人的分布式协同执行。GO-1 在国内具身大模型中率先完成了对远征 A2 双足和灵犀 X1 轮式两个形态平台的全系适配。在 2025 年客户现场演示中,GO-1 驱动的远征 A2 实现了在汽车工厂中的自主多任务切换(在不更换控制程序的情况下,从"搬运料箱"切换到"质检扫码"再切换到"工具领取")。
5.4b 具身大模型的推理硬件生态
具身大模型的部署需要在机器人本体和云端之间合理分配计算任务,形成了"边缘推理 + 云端训练"的典型架构,相关硬件生态的格局如下:
边缘计算平台(机器人本体侧):NVIDIA Jetson Thor 是当前市场上为人形机器人专门设计的主流边缘 AI SoC,提供 800 TOPS 的 INT8 推理算力,支持同时运行多个感知模型(视觉 + 深度 + 力觉融合)和 1–3B 参数级别的具身策略模型。与 Jetson Orin(275 TOPS)相比,Thor 的算力提升约 3 倍,同时将多个原本需要独立处理器的功能(图像处理、深度学习推理、运动规划)集成到单芯片,大幅降低了整机的热设计和电源管理复杂度。国内替代方向:地平线(Horizon AI)的 Journey 6 系列(ADAS SoC 向机器人迁移,2026 年推出针对具身场景的优化版本);华为昇腾 910E(小型化版本,功耗 30–50W 范围内性能与 Jetson Orin 相当)。
云端训练基础设施:当前最先进的具身大模型训练需要数百至数千个高端 GPU 的算力支撑。特斯拉 Dojo 超算集群(专为视频处理设计,最适合 FSD-style 的端到端视觉训练)、NVIDIA DGX H100/H200 集群(通用深度学习训练,宇树和智元的主要训练基础设施)是两种主流方案。中国企业的训练基础设施主要依赖:阿里云和腾讯云的 GPU 集群(按需租用)、企业自建的 NVIDIA A100/H100 集群(受出口管制影响,采购于 2022–2023 年之前的存量资产)、华为昇腾 910B/C 集群(受国产化政策推动,特别是获得国家大科学计划支持的具身 AI 研究机构)。
仿真基础设施:仿真平台在具身 AI 训练中的重要性正在快速上升。MIT 的 Genesis 仿真器(2024 年底发布,比 MuJoCo 快约 430,000 倍的 GPU 并行仿真)允许在单台 NVIDIA RTX 4090 上每秒生成数百万步的物理仿真轨迹,使得大规模强化学习训练从需要数百 GPU 集群降至单机即可进行。这一效率突破大幅降低了中小型整机厂和算法公司的具身 AI 研发成本,是 2025–2026 年具身 AI 民主化的关键技术事件之一。
推理优化工具链:将参数规模较大的具身大模型(7B–70B 参数级别)压缩到能在边缘计算平台(Jetson Thor)上实时运行(推理延时 < 50ms),需要模型量化(INT4/INT8 量化)、知识蒸馏(从大模型到小模型的能力迁移)和张量并行(在多个推理核心间分布计算)等技术。这些优化技术的成熟度,直接决定了具身大模型从研究版本到量产机型上的真实可用性。
5.5 电池、结构件与其他零部件
电池系统:全尺寸人形机器人的能量需求对应约 0.5–1kWh 的电池容量(目标续航 2–4 小时),电池组重量约 5–10kg,是整机重量中占比较大的单一模块。主流选择是高镍 NCM 三元锂电池(能量密度约 200–250Wh/kg),在保证续航的前提下尽量降低电池重量。宁德时代(300750)和亿纬锂能(300014)均与人形机器人整机企业建立了定制电池模组的合作关系,提供满足人形机器人特殊形状空间约束的异形电池模组。磷酸铁锂版本(安全性更高)在工厂场景有一定应用,防止电池热失控对工厂环境造成安全隐患。
碳纤维结构件:碳纤维复合材料(CFRP)正在人形机器人骨架和外覆件中大量应用,特别是大腿骨架、小腿骨架、躯干主结构等受力关键部位。与铝合金相比,CFRP 密度约为铝合金的 55%,比强度高于铝合金 3–5 倍,能够在保持同等结构刚性的前提下将结构件重量降低约 30–50%。国内碳纤维领域的代表上市企业包括中复神鹰(688295)和光威复材(300699)。一体化压铸铝合金在机器人关节外壳和结构连接件领域也有广泛应用,文灿股份(603348)和拓普集团(601689)的汽车一体化压铸能力正在向机器人零部件延伸。
精密轴承:精密轴承是减速器和关节执行器的支撑核心,高端人形机器人关节所需的 P4/P5 级超精密轴承长期依赖 SKF(瑞典)、FAG(德国舍弗勒集团)、NSK/NTN(日本)进口。国内人形机器人用精密轴承国产化率估计不足 20%,是上游供应链中仍高度依赖进口的薄弱环节。
磁编码器和位置传感器:高精度磁编码器(分辨率 16–24bit)是关节位置控制的核心反馈元件,直接影响机器人的运动精度。多摩川精机(日本)和瑞尼绍(英国)是国际领先品牌,国内多鑫科技、禾川科技等企业已推出可替代进口的磁编码器产品,国产化率约 30%。
5.5b 热管理系统:被低估的关键子系统
人形机器人的热管理系统在产业链讨论中常被忽视,但它是决定机器人连续工作可靠性的关键工程约束之一。全尺寸人形机器人在重载操作时,关节执行器(无框电机绕组)的温度可能迅速升至 80–120°C,超过绕组绝缘材料的温度上限(B 级绝缘约 130°C,F 级约 155°C)将导致电机损坏。同时,计算平台(Jetson Thor)在高算力推理模式下的热设计功耗约为 60–100W,在机器人密封外壳内的散热是重要挑战。
当前主流热管理方案分为三类:第一类是风冷方案,通过风扇将热量吹散,成本低但噪音大、在粉尘环境中易导致过滤器堵塞,适合实验室和低负荷场景;第二类是液冷方案,通过冷却液循环带走热量,散热效率高(约为风冷的 5–10 倍),但系统复杂(需要泵、管路、换热器),增加约 2–5kg 重量。特斯拉 Optimus 据报道采用了液冷方案;第三类是相变材料(PCM)被动热管理,利用相变材料在相变点附近大量吸热的特性平抑瞬态温度峰值,适合高峰值功率但平均功率适中的工况。
三花汽零(与三花集团关联)在微型热管理阀、电动阀和流量控制模块方面的技术积累,正是其成为特斯拉 Optimus 热管理执行器核心供应商的竞争优势所在。随着人形机器人工业化应用深化、连续工作时间要求提升,热管理系统的重要性将进一步上升,三花在这一细分方向的先发优势难以快速复制。
关节温度保护与热退化模型:高端量产机型正在引入基于物理模型的关节热退化预测——通过历史温度、电流和环境温度数据,实时预测关节电机的剩余热裕量,在热保护触发之前主动降低运动速度或关节力矩,以平滑的方式保持任务连续性而非突然急停。这一"热意识运动控制"(Thermally-Aware Motion Control)是 2025–2026 年工业量产机型的重要工程创新之一,对于提升工厂场景中机器人连续 8 小时工作的实际体验至关重要。
5.6 人形机器人与工业机器人产业链的协同与竞争
人形机器人产业链并非从零起步,而是建立在已经成熟的工业机器人产业链基础上,并在特定环节与传统工业机器人形成协同或竞争关系。理解这种关系,有助于判断哪些传统工业机器人供应商能够顺利切入人形机器人供应链。
协同领域:关节驱动电机(无框电机是有框电机的变种,工艺相通)、伺服驱动器(汇川、雷赛的工业机器人驱动器技术平移到人形机器人)、精密铸件(工业机器人底座和关节壳体加工工艺适用于人形机器人)、安全传感器(光电传感器、安全光幕等工业安全配件在人形机器人工厂部署中同样使用)。在这些协同领域,传统工业自动化企业能够凭借现有客户关系和产品认证记录,快速切入人形机器人配套业务。
竞争关系:人形机器人与传统工业机械臂在工厂场景存在一定的应用替代关系,特别是在搬运、上下料和轻度组装工位。但这种替代并非简单的"你消我长":传统机械臂在精度(定位精度 ± 0.01mm)、速度(高速运动 2–3m/s)和可靠性(MTBF > 50,000 小时)上远超当前人形机器人,适合高精度、高速、固定工位的大批量生产;人形机器人的优势是灵活性(可以换工位、换产品型号)和多功能性(同一台机器人可以搬运也可以质检)。因此,人形机器人更可能替代的是目前仍由人工而非机械臂完成的工位,而非替代已经高度自动化的工位。
减速器市场的双向增量:谐波减速器和 RV 减速器既服务于传统工业机器人(绿的谐波约 70% 的减速器销量来自工业机器人,30% 来自人形机器人),也服务于人形机器人的增量需求。随着人形机器人出货量快速增长,减速器供应商将受益于两个市场的同步增量,特别是谐波减速器因人形机器人对轻量高精度的需求偏好,在人形机器人市场的占比将高于传统工业机器人市场(工业机器人大关节更多使用 RV 减速器)。
传感器的跨界:力觉传感器(六维力传感器、触觉传感器)在传统工业机器人中应用有限(大多数工业机械臂是开环位置控制,不使用力反馈),但在人形机器人中是必不可少的核心感知元件。这意味着六维力和触觉传感器供应商面对的是一个从接近零开始的人形机器人增量市场,竞争格局将主要在新兴国产企业和进口品牌之间展开,而非在已成熟的工业机器人传感器供应链中竞争存量。
从上市公司维度看,发那科(Fanuc)、安川电机(YASKAWA)等传统工业机器人巨头在人形机器人浪潮中面临的是既是机会也是挑战的双重局面:其深厚的制造工艺积累(精密铸造、精密驱动)和品牌客户信任,是切入人形机器人市场的资产;但其核心工业机械臂业务面临人形机器人的长期竞争压力(特别是在灵活性要求高的工位),可能形成内部的商业模式冲突。国内汇川技术的策略是"两手兼顾"——继续巩固传统伺服市场的第一地位,同时大力布局人形机器人关节模组,充分利用统一的电机驱动技术平台在两个市场分别变现。
第六章 重点企业深度分析
6.1 宇树科技(Unitree Robotics)
宇树科技股份有限公司总部位于杭州,创始人兼 CEO 王兴兴持股 23.82%,控制近七成表决权(通过 AB 股架构);投资方包括腾讯、阿里巴巴(战略入股,2024 年入股,浮盈近 3 倍)、深创投、IDG 资本、源码资本等头部机构。
宇树是全球出货量最高的人形机器人企业,2025 年纯人形机器人出货量约 5,500 台,全球市占率约 32.4%,居全球第一。截至 2026 年 5 月,宇树单款双足人形机器人(H1 系列)累计生产下线约 11,000 台,年产能规划目标 7.5 万台。
核心产品线:
H1(约 180cm,约 47kg,整机约 65 万元):工业级全尺寸人形机器人,2023 年首发,2024–2025 年迭代至 H1 EDU(教育版,约 50 万元,开放完整 SDK)和 H1 PRO(商业版,面向工厂场景的加强可靠性版本)。H1 的技术特点:19 DOF 全身控制,行走速度最高约 3.3m/s,运动控制算法以全身动力学控制(Whole-Body Control, WBC)为核心,已出口至美国、日本、欧洲等超过 30 个国家,是宇树形成全球品牌影响力的核心产品。
H2(新一代旗舰,2025 年正式推出):相较 H1 全面升级,关节力矩密度提升约 30%,续航时间延长至约 4 小时(H1 约 2 小时),灵巧手 DOF 提升至 20+ DOF,整机重量优化至约 50kg,面向工业量产场景进行了全面工艺优化。H2 的市场定位是承接 H1 在工厂场景的交付,并拓展至需要更高灵巧度的电子制造场景。
G1(127cm,约 35kg,整机 9.9 万元):低成本中尺寸人形机器人,定位开发者生态和服务场景前期市场,9.9 万元的定价打破了全球人形机器人的价格下限,上市后数周内收到来自全球高校、研究院和开发者的大量订单,累计出货超过 3,000 台(2025 年底)。
Go 2(四足机器人):面向高校研究、商业巡检和消费级玩家的四足机器人,国内市场销量居四足机器人品类前列,是宇树品牌知名度的重要构成部分,并为 H1/H2 提供运动控制算法的底层积累。
财务数据(FY2025,科创板 IPO 招股书披露):全年营收 16.99 亿元,扣非归母净利润 5.9 亿元,是国内所有人形机器人整机企业中唯一实现盈利并且净利润超过 5 亿元的企业。IPO 拟募资 42.02 亿元,估值约 420 亿元,2026 年 3 月获科创板受理,6 月 1 日上会,历时 73 天,创科创板"预先审阅"机制落地以来的最快审核纪录,有望成为 A 股人形机器人第一股。
战略优势:宇树的核心竞争力是"先快后优"的迭代速度和"极致性价比"的产品策略。G1 9.9 万元的定价有效扩大了研究者生态(覆盖全球超过 30 个国家的高校和研究机构),形成了"研究者广泛使用→宇树获得更多算法生态反馈→产品性能持续改善"的良性循环。在工业化方向,H1/H2 具备出口能力,是中国品牌中少数能在全球市场与特斯拉 Optimus 正面竞争的企业。2026 年 7.5 万台的产能目标,使宇树处于量产元年最具确定性的供给端卡位点。
6.2 优必选(UBTech Robotics,港交所 9880)
优必选科技(港交所 9880)成立于 2012 年,是国内上市时间最早的人形机器人整机厂。优必选早期以消费级机器人(Alpha 系列、悟空系列)积累了品牌知名度,2020 年后全面战略转型工业人形机器人。Walker 系列是核心工业产品线:Walker S(2023 年发布)和 Walker S1(2024–2025 年量产版)是目前工业机型中落地汽车场景最深、合作主机厂数量最多的产品。
FY2025 核心数据:营收约 16.2 亿港元,工业人形机器人业务占比超过 40%,是第一大收入来源(超越了此前的教育机器人业务)。2025 年 9 月斩获全球单笔最大人形机器人商业订单 2.5 亿元,这一订单的意义不仅在于金额,更在于它打通了大型汽车/工业客户从"POC 验证"到"规模化采购合同"的全流程,为整个行业提供了商业模式可行性的标杆。
Walker S1 在汽车工厂的落地案例:比亚迪工厂——搬运上下料,效率较上一代提升一倍,稳定性提升 30%,Q2 已具备规模化交付条件;极氪 5G 智慧工厂——CTU 入库上料工位,数十台多场景(总装车间、仪表区、质检区、车门装配区)协同实训,全球首例多台多场景多任务人形机器人协同;吉利汽车——智能仓库箱体搬运;蔚来汽车——第二先进制造基地总装车间协作装配和质量检查,全球首例人形机器人与无人物流车、无人叉车、工业移动机器人的四类自动化设备协同作业。
Walker S1 的技术特点:全身 41 DOF(含 11 DOF 手部),搭载自研具身智能大模型(基于开放式感知-规划-执行三层框架),支持厂区级地图建图和多机器人集群调度,核心零部件国产化率超过 80%,整机成本较 Walker S(2024 年版)下降约 25%。
6.3 智元机器人(Agibot)
智元创新(上海)科技股份有限公司由创始人彭志辉(华为"天才少年"计划毕业生,自称"稚晖君")于 2023 年 2 月创立,总部上海张江。2025 年底累计量产突破 5,000 台,包含远征 A2 系列 1,742 台、灵犀 X1/X2 系列 1,846 台、小元 G1/G2 系列 1,412 台,是国内三条产品线并行量产、产品矩阵最完整的人形机器人企业。
核心产品线:
远征 A2(全双足,全尺寸,工业场景):搭载 GO-1 具身大模型,具备柔性制造和多任务切换能力,是智元工业人形机器人的核心商业机型,主要面向汽车工厂和精密制造客户。远征 A2 系列的 2025 年量产数量(含各版本)超过 1,700 台,居国内全双足工业机型前列。
灵犀 X1/X2(全双足,轻量化,服务/科研):高约 165cm,重约 65kg,设计目标是比全尺寸工业机型更轻便、更适合近距离服务场景;X2 在 X1 基础上进行了灵巧手和感知能力的升级。
小元系列(移动底座+双臂操作,精密操作平台):面向 3C 精密装配、实验室操作和电商仓储分拣,成本显著低于全尺寸人形机器人,是智元针对短期内"双臂操作需求远大于行走需求"市场现实推出的过渡产品。
融资与资本结构:智元机器人完成多轮融资,投资方阵容包括:高盛(参与 2024 年 A 系列融资)、京东集团(JD.com,2025 年新一轮)、上海具身智能产业基金、穆华基金、丽格资本等,总估值超过 150 亿元。
技术亮点:GO-1 具身大模型采用多任务端到端学习架构,核心特点是少样本泛化(从约 50–200 次人工示教数据快速学习新任务)和多机协同调度(支持多台智元机器人通过云端调度系统协同完成复杂任务流)。2025 年,GO-1 驱动下的远征 A2 在客户现场实现了工厂环境中的自主多任务切换,是国内具身大模型在真实工厂商业场景中距离自主化最近的案例。
6.4 银河通用机器人(Galbot)
银河通用机器人(Galaxy General Robotics)由王鹤博士(清华大学计算机系机器人学教授)联合创立,是国内"具身大模型与通用机器人深度融合"技术路线的代表性企业。核心产品 Galbot G1 是一款轮式移动底座+双臂仿人操作的通用机器人平台,重点面向电商仓储(亚马逊风格的全品类分拣)和工厂物料配送场景。
银河通用的技术差异化在于:将大型语言模型(LLM)与具身机器人的行为规划深度耦合,使机器人能够理解开放性自然语言任务指令("把 A 货架第三层左起第二个商品取出,检查是否有损坏,如果完好放入 B 区货箱"),并自主分解为可执行的运动序列。这一"语言驱动的任务分解"能力,在高 SKU 密度的仓储场景中比传统条形码扫描 + 预编程抓取方案具有更高的灵活性。
2025 年完成超过 7 亿元融资,并与顺丰、菜鸟等头部物流企业签署了合作协议,进行仓储场景 POC 验证。
6.5 傅利叶智能(Fourier Intelligence)
傅利叶智能成立于 2015 年,总部上海,是国内人形机器人领域布局时间最早的企业之一。公司起步于医疗康复外骨骼,积累了精密电机驱动和力控技术,2022 年后推出 GR-1 通用人形机器人,完成战略转型。
GR-1(约 165cm,约 65kg,整机售价约 70 万元)采用 40 DOF 全身设计,拥有 6 DOF 腰部结构(区别于多数竞争对手的 2–4 DOF 腰部),能够更好地模仿人类的弯腰搬运动作,在 10–20kg 范围内的搬运任务上有工效学优势。GR-1 于 2023 年在日本东京参加了具身 AI 研究者的国际性演示活动,是第一款真正在海外大型技术活动上进行公开展示的中国人形机器人。
2025 年,傅利叶完成超过 10 亿元 C 轮融资,并开始向汽车零部件企业(主要是一级供应商)和职业技能培训机构(汽车专科院校、技术培训机构)交付 GR-1。傅利叶的双赛道战略(康复外骨骼 + 通用人形机器人)为其提供了稳定的现金流基础,在高烧钱的人形机器人赛道中是为数不多具有自我造血能力的企业。
6.6 众擎机器人(EngineAI Robotics)
众擎机器人由前大疆工程骨干团队创立,总部深圳,依托大疆在消费级和商业级无人机领域积累的精密机电制造和产品工程化能力。2025 年发布的 PM01(约 164cm,约 60kg)的核心竞争策略是极致成本控制与价格破圈:整机售价 8.8 万元起(含基础传感器套装),是当前市场上全尺寸人形机器人中最低的商用定价,直接面向开发者生态、科研机构和服务类应用场景。
PM01 8.8 万元定价的意义在于:将整机采购门槛从"大型企业采购预算"拉到"小型企业和高校部门预算",大幅扩大了潜在客户基础。众擎同时推出 SE 系列(强化版工业机型),面向制造业定制化部署需求,定价高于 PM01 基础版。
6.7 逐际动力(LimX Dynamics)
逐际动力(LimX Dynamics)由清华大学控制系背景的团队创立,专注于腿足式机器人的极限运动控制技术。旗舰产品 CL-1 是全双足人形机器人,以极高的运动鲁棒性著称——CL-1 在公开发布的演示中展示了在碎石地面、不规则坡道、动态踏板和外力干扰下的自主平衡行走能力,运动控制水平在国内双足机器人中处于第一梯队。
运动控制的极限鲁棒性是逐际动力相较竞争对手最显著的技术差异化:许多国内竞争对手的机器人在障碍物和动态干扰下表现明显不稳定,而 CL-1 的摔倒频率显著更低,这一能力是人形机器人在复杂工厂环境(地面不平、偶有碰触)中可靠运行的基础保障。
6.8 达闼科技(CloudMinds)与乐聚机器人
达闼科技是国内最早布局"云端机器人"概念的企业(2015 年成立),其技术主张是将机器人的大算力 AI 推理上移到云端,降低本体制造成本,通过 5G/6G 网络实现低延时的云端控制。HARIX 系列人形机器人(Cloud Ginger 等型号)在酒店、商场、博物馆等商用服务场景保持了常态化商业运营,在服务场景的自然语言交互和多模态对话上有积累。
乐聚机器人(山东大学孵化)以高表演性和舞蹈机器人起家,近年转型工业人形机器人,推出 Kuavo 系列,主要面向工厂演示和早期商业部署,在国内有一定品牌知名度。
6.8b 星动纪元(Robot Era)与穹彻智能:清华系具身智能创业群
清华大学在具身智能和人形机器人领域孵化了多家具有代表性的创业公司,形成了独特的"清华系具身智能创业集群",这一集群是北京人形机器人创业生态的核心组成部分。
星动纪元(Robot Era):由清华大学计算机系高阳教授团队联合创立,核心技术方向是全身具身感知与任务学习。团队的研究特色在于:将自然语言理解(LLM)与全身运动控制深度融合,使机器人能够理解复杂的自然语言任务描述(如"把桌上的蓝色杯子移到窗边的花盆旁边"),并自主规划行走路径和抓取姿态。星动纪元的 XBot-L(约 173cm,约 65kg,18 DOF)在 2025 年完成了多所顶级高校实验室的首批交付,并与一家汽车零部件 Tier 1 供应商签署了 POC 协议,是清华系整机厂中商业化进展最快的一家。
穹彻智能:聚焦于具身大模型的基础架构研究,核心团队包括来自清华大学、北京大学和卡内基梅隆大学的 AI 研究者。穹彻智能的技术路线是"模型优先"——先构建通用的具身大模型框架,再适配到市场上的主流整机(宇树、智元)。其主要研究成果集中在多任务具身学习(单模型处理搬运、装配、质检等多种任务类型)和跨具身形态迁移(同一模型参数迁移到不同 DOF 的机器人平台)。穹彻已获得北京亦庄产业基金的早期投资,定位为具身大模型的基础设施提供商,而非整机厂。
逐际动力(LimX Dynamics):已在前文单独介绍,但值得补充的是:逐际动力的运动控制技术路线与星动纪元的具身感知路线形成了互补——前者擅长极限运动鲁棒性,后者擅长语言驱动的任务理解,两者的技术合作关系值得关注。
清华系创业集群的集体优势:清华大学的机器人和 AI 研究资源(THUML、IIIS、AIR 人工智能研究院)为这些创业公司提供了持续的技术输血渠道,清华校友网络也是早期融资的重要来源。清华系整机厂和算法公司的集中落地北京亦庄,形成了一个小规模但高密度的具身智能创新生态,其研究产出的质量和速度在国内处于前列,是未来 2–3 年具身 AI 领域重要突破的潜在发源地。
6.9 穹彻智能与新兴具身大模型创业公司
穹彻智能(北京)是专注于具身大模型基础研究的创业公司,核心团队来自清华大学、北京大学和卡内基梅隆大学,其研究方向聚焦于多模态具身感知和操作策略的统一架构。穹彻智能获得了北京亦庄经开区产业基金的早期投资,代表了一类"模型优先、整机后置"的创业路径——先构建通用具身大模型,再适配到市场主流整机平台(宇树、智元等),而非从头研发整机。
在更广泛的具身大模型创业生态中,中国已涌现出一批以算法为核心差异化的初创公司,其中值得关注的方向包括:多模态强化学习框架(针对人形机器人的全身动力学控制)、开放世界物体识别与抓取规划(解决非结构化场景的物体泛化)和基于 VR/AR 的高效遥操作数据采集系统(解决具身学习数据的生产效率问题)。这些初创企业的核心价值将在 2026–2027 年逐步明朗,届时整机厂的竞争将从"谁能量产"转向"谁能让机器人更聪明",算法公司的市场地位将显著提升。
6.10 上游关键供应商扩展分析
人形机器人整机市场的竞争固然重要,但上游关键供应商的竞争格局同样深刻影响整个产业的价值分配。以下对几家在各自细分领域具有重要意义的上游供应商进行扩展分析:
秦川机床(000837)是中国磨齿机领域的绝对龙头,国内市场份额约 60%。秦川机床凭借精密磨削工艺积累,正在推进行星滚柱丝杠等精密滚动传动元件的研发和量产,是国内少数同时在精密齿轮传动和精密直线传动领域有深度积累的企业。秦川的参与,将为国内行星滚柱丝杠赛道引入一个拥有精密磨削自制能力的竞争者,加速国产化进程。
双环传动(002472,双环传动)的 RV 减速器业务在人形机器人赛道增长最为显著。双环传动传统主业是汽车变速箱齿轮,公司利用在精密热处理和磨齿工艺上的积累横向进入 RV 减速器,形成了与绿的谐波差异化的产品矩阵:绿的谐波主要供应谐波减速器,双环传动主要供应 RV 减速器,两者合力覆盖人形机器人关节减速器的主要需求,形成国产减速器对进口品的联合替代力量。
雷赛智能(002979,雷赛智能)的核心产品是运动控制器和多轴驱动模块。在人形机器人领域,运动控制器的作用是实现多关节的同步协调控制(全身动力学控制 WBC 的硬件底座),这一需求对控制器的实时性(控制周期 < 1ms)和多轴同步精度有极高要求。雷赛智能 2025 年发布了面向人形机器人 10–40 轴同步控制的专用运动控制器产品,已进入宇树、傅利叶等整机厂的供应商评估名单。
中大力德(002896,中大力德)是精密减速器领域的另一个重要国产玩家,旗下产品涵盖谐波减速器、RV 减速器和行星减速器三大类,虽然整体规模不及绿的谐波,但在特定型号规格上与整机厂形成了更灵活的定制化供应关系。
第七章 产业带地图与制造集群
7.1 深圳南山/龙华——具身智能硬件研发高地
深圳是中国人形机器人供应链最完整的地区之一,也是国内消费电子和智能硬件制造生态最成熟的城市。人形机器人相关企业在深圳的布局包括:宇树科技深圳研发中心(与杭州总部协同,聚焦工业应用场景研发)、众擎机器人(深圳总部,大疆供应链生态赋能)、奥比中光(深圳,深度相机国产龙头)、速腾聚创(深圳,固态激光雷达)、汇川技术(深圳南山制造基地)。
南山科技园和光明区已形成以具身智能为主题的创新集群,南山区政府专项产业扶持资金重点支持人形机器人整机、核心传感器和具身大模型研发企业落户。深圳的核心优势是深度融合的消费电子和工业自动化供应链生态——三花智控、比亚迪电子、立讯精密、鹏鼎控股等顶级工业制造企业的配套网络,为人形机器人结构件、电子控制板和精密连接器的快速采购和迭代提供了无可比拟的便利。
7.2 北京海淀/亦庄——政策与科研双引擎
北京是中国具身智能政策支持力度最大的城市,也是人形机器人相关高校资源最集中的区域(清华大学机械系和计算机系、北京大学信息工程学院、北京航空航天大学机器人研究所等)。
北京亦庄经济技术开发区设立 10 亿元人形机器人专项产业基金,已出资银河通用机器人(清华系)、星动纪元(Robot Era,清华系)、穹彻智能等具身大模型方向企业,并为整机厂落户提供土地和产业政策支持。北京人形机器人集群的特点是研发密度高、科研转化成果多,整机制造规模相对较小,以技术输出、系统集成和 AI 基础研究为主。
7.3 上海张江/闵行——产学研融合制造核心
上海是人形机器人整机研发和制造能力最系统的城市:智元机器人(张江总部,约 600 人团队)、傅利叶智能(松江总部)、宇树上海研发中心(闵行)、达闼科技(上海)均在此聚集,形成了上海具身智能产业带的核心区段。
张江人工智能岛是国内具身智能产业的标志性聚集区,上海市人工智能实验室(SHLAB)和上海具身智能产业基金的入驻,使其成为基础研究(开放具身算法模型)和产业化(整机落地)同步推进的高密度创新场。上海制造业服务体系成熟(精密铸造、机电集成、精密测试),工业人形机器人从研发到小批量生产的全链条能力较为完整。
7.4 苏州工业园区——零部件制造核心基地
苏州是中国人形机器人核心零部件企业最集中的城市,直接为长三角整机厂的量产需求提供零部件支撑。绿的谐波(688017,相城区):国产谐波减速器龙头,苏州工厂 2025 年谐波减速器产能超过 50 万套/年,并持续扩产;汇川技术(苏州工业园区制造基地):国内伺服电机和驱动龙头;步科股份(603160,苏州工业园区):伺服电机和运动控制龙头;以及大量精密机械加工、轴承和精密弹簧配套企业。
苏州工业园区和相城区的配套政策(土地优惠、税收减免、研发补贴)吸引了零部件企业持续扩产,2025 年苏州已成为国内人形机器人关节执行器零部件产值最大的单一城市,其谐波减速器+伺服电机的双核优势将在 2026–2028 年进一步放大。
7.5 广东东莞/佛山——工业应用最密集区
东莞和佛山是中国制造业密度和多样性最高的地区之一,3C 电子(华为、OPPO、vivo 供应链)和汽车零部件(梅赛德斯-奔驰、丰田在广东的供应链配套)企业高度集聚,是人形机器人工业应用场景最丰富的潜在需求市场。东莞松山湖科技产业园的精密制造配套体系正在接入人形机器人供应链,拓普集团、文灿股份的一体压铸能力和东莞消费电子制造配套生态为人形机器人结构件和电子控制系统的快速迭代提供了支撑。
在天下工厂平台上,上述产业带的工业配套供应商、零部件厂商和系统集成企业已有数百家完成企业认证,覆盖了谐波减速器、伺服电机、精密轴承、精密铸件和碳纤维结构件等主要品类,为人形机器人整机厂的国内采购提供了标准化询价和企业认证渠道,有效降低了供应链管理成本。
7.5b 中国人形机器人产业带的经济贡献与就业影响
人形机器人产业带的发展不仅带动了直接就业(整机制造、零部件生产、系统集成),更通过产业链乘数效应带动了间接就业(设备制造、材料供应、物流配送、工程服务)。以苏州工业园区和相城区为例:绿的谐波一家企业 FY2025 营收 5.71 亿元,带动的上游材料(柔轮合金钢、精密弹簧)和精密加工配套企业产值约为其 1.5–2 倍(即约 8–11 亿元配套产值);汇川技术苏州制造基地年产值超过 50 亿元,带动苏州精密机械加工配套企业产值约 30–40 亿元。
从就业结构看,人形机器人产业带吸引了大量高学历工程技术人才(机械、电子、自动化、计算机专业)从上海、北京等城市流入,改变了苏州、深圳部分区域的人才结构,提升了当地制造业的附加值和技术层次。这与此前的汽车和消费电子产业带形成的大规模普通制造业就业有本质不同——人形机器人产业带的就业乘数在技术岗位上更高,对当地产业升级的带动效应更显著。
地方政府的"机器人经济"账:对于设立专项产业基金(北京 10 亿元、上海具身智能产业基金等)的地方政府而言,吸引一家估值 100 亿元以上的人形机器人整机厂落地的经济账如下:整机厂和配套企业的直接税收贡献(所得税+增值税)约为产值的 8–12%;带动的高薪就业岗位(人均年薪约 30–50 万元)所产生的个税贡献约 2–5% 有效税率;配套产业生态的集聚效应(吸引上下游企业落地)放大因子约 3–5×。因此,一家人形机器人整机厂 100 亿元的产值,对地方财政的贡献估计在 10–20 亿元/年,是地方政府愿意以产业基金出资换取企业落地的重要经济逻辑。
产业带格局的长期演变:基于当前各地政府的招商政策和企业的战略布局趋势,2026–2030 年中国人形机器人产业带格局预计将呈现出以下演变:上海(张江+松江)将成为全球人形机器人研发密度最高的城市,整机研发团队密度超过北京和深圳;深圳(南山+宝安)将成为人形机器人出货量最大的制造城市,依托完整的消费电子供应链和港口出口优势;苏州(工业园区+相城)将成为核心零部件(减速器+电机+驱动器)价值最集中的产业带;北京(亦庄+海淀)将成为具身大模型研发最密集的知识中心和政策辐射源点;广东东莞/佛山将成为人形机器人工业应用场景最密集的客户聚集地,同时也是供应链加工配套最强的制造区域。
7.6 海外制造集群
**美国加利福尼亚州(硅谷/湾区/洛杉矶)**是全球人形机器人创业企业浓度最高的地区。Figure AI(圣何塞总部)、1X Technologies(在湾区有研发据点)和 Sanctuary AI(与斯坦福大学有合作关系)均在此布局。NVIDIA 圣克拉拉总部提供算力生态底座;谷歌 DeepMind 机器人团队(芒廷维尤)是具身大模型基础研究的全球中心之一。全球最高浓度的风险资本在此聚集,OpenAI、微软、贝佐斯风险投资均向湾区人形机器人项目注资。
**美国德克萨斯州(奥斯汀)**是特斯拉德克萨斯超级工厂的所在地,也是 Apptronik 的总部城市。特斯拉在德克萨斯超级工厂新建专用 Optimus 生产线,远期年产能目标百万台级,将使德克萨斯成为全球最重要的人形机器人单一制造基地。
挪威奥斯陆:1X Technologies 在挪威保留重要的研发和数据积累中心,依托挪威较高的工程人才质量和相对宽松的机器人实地测试法规,是其具身学习数据积累的主要场所。
**德国(莱比锡/柏林/斯图加特)**是欧洲人形机器人工厂应用最活跃的市场:宝马莱比锡工厂正式部署 Figure 机器人(欧洲首家),梅赛德斯-奔驰柏林数字工厂测试 Apptronik Apollo,大众汽车(沃尔夫斯堡)也开始评估人形机器人在焊装车间的应用潜力。德国 KUKA 机器人、博世力士乐(Bosch Rexroth)正在将人形机器人技术纳入其下一代制造自动化解决方案。
第八章 细分专题深度研究
8.1 工业制造型人形机器人
工业制造场景是当前和未来 5 年内人形机器人市场规模最大、变现路径最确定的细分方向,是"量产元年"的核心战场。工业场景的需求逻辑高度清晰:以接近人力综合成本的 TCO(总拥有成本)替代高重复性、高强度的体力劳动岗位,同时提供 24/7 不间断工作的运营能力(人类工人需要换班,机器人在电池续航范围内可连续工作)。
汽车工厂是最先规模化落地的工业子场景,四大驱动因素共同作用:汽车制造流程已高度标准化(易于机器人任务定义和场景复用);大型汽车集团的利润率支撑了人形机器人早期较高的 POC 和部署成本;主机厂有战略动力推动供应链数字化和智能化转型(应对劳工成本上升和产线柔性化需求);人形机器人整机厂主动以汽车主机厂为首发客户,以获取最有说服力的商业背书。
2025 年已经形成的可量化里程碑数据:Figure 02 在 BMW Spartanburg 工厂累计运行 1,250 小时,支撑 30,000+ 辆 BMW X3 生产,移动 90,000+ 零部件(来源:Figure AI 官方公告及 BMW 集团新闻稿);优必选 Walker S1 在极氪 5G 工厂完成数十台多场景协同实训(全球首例规模化多台多场景多任务协同);特斯拉 Optimus 在 Fremont 工厂全天候执行电池组线束组装(内部部署,约 5,000 台当量);Apptronik Apollo 在梅赛德斯-奔驰柏林工厂启动惰性物料搬运的商业测试;宇树 H1/H2 进入多家中国 EV 厂商的 POC 评估流程。
**电子制造(3C 制造)**场景是继汽车之后市场规模第二大的工业潜力市场。3C 制造包括智能手机、平板、笔记本电脑的组装(结构件安装、功能测试、包装入箱),对机器人的核心要求是灵巧手精度和视觉感知精度,而非承重能力。国内一线 EMS 厂商(鸿海精密 Foxconn、立讯精密、富士康等)和品牌厂(华为终端、小米、比亚迪电子)已开始对人形机器人进行系统性工位评估,预计 2026–2027 年将出现第一批批量采购订单,每批 50–200 台不等。
实现瓶颈分析:工业型人形机器人在扩大场景覆盖时面临的最大障碍是场景迁移成本——目前每迁移到新工位(即使是同类型任务但工件形状不同)需要 100–500 次人工示教和数天的模型微调,这使得人形机器人的经济账局限于高价值、高重复度、场景相对固定的工位(汽车总装固定工位、电子制造高标准化工位)。如果具身大模型的泛化能力在 2027–2028 年实现突破(目标:单次演示 < 10 次,1 天内完成新工位适配),则工业型人形机器人的可覆盖工位数量将出现指数级扩张,市场规模预估将大幅上修。
8.2 仓储物流型人形机器人
物流仓储是人形机器人商业化最早形成量化商业闭环的场景。Agility Robotics Digit 在 GXO 仓库完成 100,000+ 次料箱搬运,这是行业里第一个可以写进商业计划书的人形机器人规模化数字。
仓储场景的人形机器人需求结构:头部电商(亚马逊、JD.com、阿里)的自营仓网是最重要的早期客户,因为头部电商有足够规模使 RaaS 单价具有竞争力,同时有足够的工程能力配合机器人集成;合同物流(GXO、顺丰、快递柜)是第二大潜力市场,其劳动力成本压力在双十一等旺季尤为突出;冷链仓储是特殊场景,低温环境(-25°C 至 -5°C)对人类操作效率影响很大,反而是机器人的优势场景,有望成为 2026–2027 年的增量市场。
国内物流仓储场景的主要竞争者:智元远征 A2-W 已在 JD.com 物流仓库开始测试,银河通用 Galbot G1 正与顺丰和菜鸟推进 POC,宇树 H2(轮腿复合版规划中)也瞄准仓储场景。
8.2b 仓储场景的技术规格差异化
人形机器人在仓储场景的技术选型与工厂场景有显著差异,理解这些差异对于评估哪些整机厂能在仓储场景获得主导地位至关重要。
仓储场景的核心技术需求:全向移动能力(窄货架通道通行,转弯半径要求 < 500mm);高效率抓取(每小时 200–400 次拣货,对应单次抓取周期 < 10 秒);3D 视觉 + 条码识别的融合感知(同时识别物体位置和 SKU 编码);4–6 小时续航(单班不中断运行);多机器人协同调度(共享仓库地图和任务队列)。
对比工厂场景,仓储场景对双腿步行能力的要求相对较低(平整地板为主),但对移动速度和能效要求更高。这使得轮式人形机器人(如智元远征 A2-W)在仓储场景的经济性优于全双足机型——轮式底盘能效约为双足步行的 3–5 倍(相同速度和载重下),同时提供更稳定的运载平台(不存在双足步行的振动问题,有利于精密物品的仓储操作)。
电商仓储的 SKU 多样性挑战:亚马逊仓库的 SKU 数量超过 4 亿,每个 SKU 对应不同的形状、材质、重量和包装,这对机器人的抓取泛化能力提出了极高要求。Agility Digit 在 GXO 的部署之所以能成功,部分原因是选择了"标准尺寸料箱搬运"这一高度标准化的任务(料箱形状和重量范围已知),而非高 SKU 多样性的全品类分拣。真正的全品类分拣(可以抓取任意形状的商品)需要具身大模型在"任意物体抓取"上实现泛化,这是 2027–2028 年才可能部分解决的技术挑战。
RaaS 商业模式的中国本土化:国内智元机器人和银河通用机器人正在研究将 Agility 的 RaaS(Robot-as-a-Service)模式本土化。在中国,物流和仓储企业的资本开支偏好(倾向于租赁而非购买)与 RaaS 模式天然匹配。预计国内首批 RaaS 合同将于 2026 年下半年至 2027 年出现,初期以 JD.com、顺丰自营仓库为主要客户。
8.3 商用服务型与其他场景
商用服务场景(酒店迎宾、商场导览、展会接待、博物馆讲解、机场引导)是人形机器人"形态溢价"最显著的场景。相对于 AGV 或轮式服务机器人,人形的外观形态更能增强场景的互动感和品牌价值。达闼科技的 HARIX 系列、优必选 Walker(服务版)在五星级酒店和大型会展场馆已实现常态化运营,这些案例更多体现的是品牌营销价值而非经济替代效益。
科研开发生态是整个产业的算法"苗圃"。宇树 G1(9.9 万元)已在全球超过 300 所高校实验室部署,与 NVIDIA Isaac GR00T 开源框架形成了"平台+生态"的强正反馈。学术界在具身 AI 算法上的持续输出(扩散策略、VLA 模型、世界模型等),是推动整个产业技术进步的基础研究来源。
8.3b 制造业场景下人形机器人的商业模式演进
人形机器人在制造业的商业模式正在经历从"整机销售"向"多元化服务+数据飞轮"的深度演变,这一转变将深刻影响整机厂的收入结构和竞争格局。
整机销售(CapEx 模式):这是目前最主流的商业模式,整机厂将机器人作为固定资产出售给工厂客户,收取整机购置费(30–65 万元/台)和系统集成费(5–15 万元)。工厂客户对资本支出的控制偏好使得这一模式面临采购决策周期长(6–18 个月)的挑战,但对整机厂而言,每台机器人的单次收入最大化,也不存在长期合同到期不续约的风险。
机器人即服务(RaaS,OpEx 模式):以 Agility Robotics 在 GXO 的实践为代表,工厂客户按每次有效操作(每搬运一个料箱)支付服务费用,无需购买机器人。对客户而言,RaaS 将大额资本支出转为经常性运营支出,降低了决策门槛;对整机厂而言,RaaS 提供了可预测的经常性收入,同时保留了对机器人的所有权和数据收集权。RaaS 模式在仓储场景(任务高度标准化,单次操作成本可量化)比工厂场景(任务多样,计费标准复杂)更容易实现。国内智元和宇树均在研究 RaaS 模式,预计 2026–2027 年推出试点合同。
按时间计费的人力外包替代模式(HaaS,Human-as-a-Service 替代):一种新兴的中间形态是"按小时计费的机器人租赁",整机厂或中间服务商拥有机器人,按"机器人工时"出租给工厂,每工时收费约 30–80 元(与人工小时成本接近),工厂按实际使用工时支付,整机厂负责运营和维护。这一模式的优势是将机器人的可靠性风险留在整机厂(促使整机厂持续改进可靠性),而不是全部转嫁给客户(购买后损坏的维修成本由客户承担)。
数据服务与模型订阅:随着具身大模型的重要性上升,整机厂将逐步推出"模型订阅"服务:工厂购买整机后,每月支付具身大模型更新订阅费(类似特斯拉 FSD 订阅),获取不断改进的 AI 能力(新工位适配速度提升、泛化能力扩展)。这一模式将整机厂的收入从一次性整机销售延伸为持续的软件服务收入,类似于 SaaS 公司的收入模式,显著改善了整机厂的估值逻辑。
系统集成与解决方案服务:大客户(汽车主机厂、大型 EMS 厂商)通常需要整机厂提供从工位分析、机器人选型、工装夹具设计、系统调试到操作员培训的全流程交钥匙服务,这部分服务的单价较高(5–30 万元/工位),也有助于整机厂与客户形成深度绑定,降低被竞争对手替换的风险。
数据飞轮效应:机器人在工厂运行过程中持续收集操作数据(图像、力矩、关节状态),这些数据对于训练具身大模型极为珍贵。拥有最多在役机器人、收集最多工厂操作数据的整机厂,能够以最低的边际成本持续改进其具身大模型性能,形成"部署规模 → 数据量 → 模型性能 → 更多部署"的正反馈飞轮。特斯拉是这一模式在自动驾驶领域的典型案例(全球 500 万辆特斯拉车辆持续传输行驶数据),而 Optimus 的规模化量产将把同样的飞轮机制带入人形机器人,使特斯拉在 2027–2028 年获得迄今最大规模的真实工厂操作数据集。
8.4 灵巧手:精细操作的核心模块
灵巧手(Dexterous Hand)是人形机器人实现精细操作的关键模块,也是当前整个系统中技术成熟度最低、投入产出比最高的研发方向。人类手部拥有约 27 个自由度,当前商用人形机器人手部 DOF 通常在 10–22 之间,从 15 DOF 到 22 DOF 的提升,使机器人能够处理直径 < 5mm 的小螺钉、柔性线缆和多形状物体。
主流灵巧手技术路线分为腱驱动(轻量高 DOF,但传动摩擦控制难)和连杆+微电机(精确可靠,但重量较高)两类。Figure 02/03 的手部采用连杆+微电机方案,16 DOF,每只手约 500g;优必选 Walker S1 的 11 DOF 手部能执行精密插拔和多指协调;宇树 H2 手部 DOF 提升至 20+ DOF,兼顾力量和精度。
国内灵巧手领域的代表性企业:灵心巧手(成都,柔性腱驱动)、因时机器人(北京,气动和线驱结合)、松延动力(上海,微型执行器一体化)等,部分产品已作为独立配件供给整机厂。
8.4b 人形机器人的关键工业工位分析
以下对人形机器人在工业场景中最具经济价值的具体工位进行深度分析,为工厂采购决策者和投资者提供更精细的应用落地图景:
工位一:物料配送(最成熟,当前第一大应用) 将原材料、半成品、工具从仓库或暂存区配送到生产工位,替代人工推车或叉车运输。技术要求:自主导航(SLAM 建图+路径规划)、承重(20–40kg)、货架识别和抓取(箱/托盘标准化)、与 WMS/MES 系统对接。经济价值:一名专职物料配送工人年综合成本约 8–12 万元,机器人替代后的年均成本(购置摊销+维护)约 3–8 万元,ROI 约 1–3 年。这是当前人形机器人投入产出最优化的工位,也是 2025 年落地案例最多的类型(优必选/智元在汽车工厂的主要实训场景)。
工位二:上下料(第二大应用,精度要求适中) 将工件从料架/料盒取出,放入机床或检测设备,加工/检测完成后取出放回。技术要求:精确抓取(工件形状多样,需视觉引导)、与机床/设备的安全交互、工件定向放置(姿态控制精度 ± 5mm)。经济价值:上下料工人的重复性极高、劳动强度较大,是制造企业最愿意替换的工种之一,年综合用工成本约 8–15 万元,机器人替代成本约 4–10 万元,ROI 约 1.5–3 年。优必选在比亚迪工厂的效率提升一倍数据,印证了这一工位的技术可行性。
工位三:质量检测(高价值但技术难度高) 外观目检(查找表面划痕、变形、颜色异常)、尺寸测量(使用量具检测关键尺寸)、功能测试(插拔测试、按键测试)。技术要求:高精度视觉感知(分辨率 ≥ 5MP,识别精度 ≤ 0.1mm 的缺陷)、灵巧手操作(使用量具或插拔连接器)。经济价值:质检工人年综合成本约 10–18 万元(精密零件检测涉及较高技术水平),机器人替代的 ROI 约 2–4 年,但需要灵巧手达到 15+ DOF 且具身大模型能够处理多样化缺陷类型(对泛化能力要求较高)。2025 年已有初步落地案例(优必选在极氪工厂的质检区协同实训),但距离独立完成全检流程仍有差距。
工位四:精密装配(最难、最高价值) 螺钉拧紧(力矩控制)、接插件装配(精密插拔,对准精度 ± 0.5mm)、线束整理(柔性工件,操作复杂)。技术要求:20+ DOF 灵巧手 + 高精度六维力反馈 + 具身大模型对精密操作的泛化。经济价值:精密装配工人通常是高技能工种(年薪约 15–30 万元),替代价值最高,但技术难度也最高。预计 2027–2028 年,全双足人形机器人才能在有限的精密装配工位(标准化程度较高的子集)实现可靠部署,大规模替代精密装配工种预计在 2029–2030 年。
工位五:末端包装与入箱(中等难度,增量市场) 将产品放入纸箱或托盘、封箱、贴标、码垛。技术要求:多形状物体抓取(产品包装多样)、箱体开合(柔性操作)、准确放置(避免碰撞)。经济价值:包装工岗位劳动强度大(长时间站立重复操作)、人员流动率高,年综合用工成本约 6–10 万元,机器人替代 ROI 约 1.5–2.5 年。包装场景对机器人灵巧手要求低于精密装配,但对速度要求较高(每小时 100–200 次操作),是 2026–2027 年具有较高商业可行性的批量落地工位之一。
8.5 双臂协作与具身大模型的交叉
双臂协作系统(固定或移动底座+双臂)是介于传统工业机械臂和全尺寸人形机器人之间的过渡产品,2025–2027 年在工厂和仓储场景有重要的市场价值。与传统双臂协作机器人(如 ABB YuMi)相比,具身 AI 加持的双臂系统(如智元小元系列)在任务灵活性上有本质不同——可以通过自然语言指令适应新任务,而非逐行编写动作程序。随着具身大模型泛化能力的提升,双臂协作系统在精密组装、PCB 检测、食品加工等高 SKU 场景的适应性优势将愈加显著。
第九章 技术演进路径
9.1 具身智能大模型:从"动作克隆"到"泛化推理"
当代人形机器人 AI 的核心技术挑战可以用一句话概括:如何让机器人用"少量示教"完成"从未见过的任务"。传统机器人控制的逻辑是"为每个任务编写程序",本质上是前深度学习时代的范式——规则驱动、适用范围极窄、对环境变化脆弱。具身智能大模型的核心目标是打破这一"任务锁定"约束,让机器人具备类似人类的通用操作能力。
目前业界公认的技术路线图从浅到深分为三个层级:第一层级是"动作克隆"(Behavioral Cloning)——通过大量人工示教数据(Teleoperation 采集)训练模型复现特定任务,已在工厂固定工位有良好表现(Figure 02 在 BMW 的部署);第二层级是"弱泛化"——在相似任务和相似环境中实现迁移(换了工件颜色或形状仍能完成同类任务),当前最先进模型可以实现弱泛化;第三层级是"强泛化"(Open-World Generalization)——完全陌生的任务在语言描述下自主完成,是当前所有具身 AI 系统的共同技术天花板,预计 2027–2028 年才可能出现真正可靠的突破案例。
视觉-语言-动作(VLA)模型是当前最前沿的技术路线。以 NVIDIA GR00T N1 和 Figure Helix 为代表,将视觉编码器(提取图像特征)、大型语言模型(理解指令、推理任务)和动作解码器(生成关节控制序列)融合为端到端统一模型。VLA 的核心优势是能够利用互联网规模的视觉-语言预训练知识(从数十亿张图文对中学到的物理常识),提升跨场景泛化能力。NVIDIA GR00T N1 通过 780,000 条合成轨迹辅助训练,实际操作性能提升 40%,证明了高质量合成数据对减少真实数据采集成本的有效性。
扩散模型动作策略(Diffusion Policy)是另一主流路线。将动作生成建模为扩散过程(类似图像生成的扩散模型),通过迭代去噪生成高质量动作序列。扩散策略在以下场景有独特优势:抓取多样性物体(从立方体到不规则形状的泛化);双峰动作分布处理(面对同一场景,机器人有多种合理操作方式,扩散模型能有效捕捉这种多模态分布)。
世界模型+强化学习(World Model + RL)是最前沿但距离量产最远的路线。训练一个能够预测物理世界动态的"世界模型",机器人在虚拟世界中通过强化学习积累经验,再迁移到真实世界(Sim-to-Real)。NVIDIA Cosmos 世界基础模型(2025 年 1 月发布)和 Google DeepMind 的 Genie 2 是代表作。
9.2 端到端控制与模块化控制之争
人形机器人 AI 系统架构存在两种范式的根本分歧:
端到端(E2E)路线主张将感知、规划和动作生成融合为单一神经网络,不设计任何中间表示(中间状态、任务规划树等)。特斯拉 Optimus 是这一路线最激进的推进者:直接移植 FSD 的 Occupancy Network 视觉特征提取和视觉 Transformer 架构,以海量真实操作视频数据训练端到端的视觉-动作策略网络,目标是实现"无需任何手工工程,直接从像素到关节"。E2E 路线的潜在优势是"扩展律"(Scaling Law)——随着模型规模和数据量增加,性能持续可预测地提升;缺点是可解释性低(不知道模型为什么做出特定动作决策),在发生错误时难以快速诊断修复。
模块化控制路线(Hierarchical/Modular Control)保留了感知-规划-执行的显式分层架构:高层次任务规划使用大型语言模型(理解指令,分解子任务);中层次运动规划使用轨迹优化算法(生成可行的运动轨迹);底层关节控制使用经典 PD/力矩控制(精确跟踪关节角度或力矩)。优点是可解释、可调试,工程师可以针对特定层次进行定向优化。
混合路线是当前工业量产机型的主流:高层用 LLM/VLM(语言指令理解)+ 中层用轨迹优化 + 底层用经典控制。这一组合在工程可靠性和智能化程度之间取得了折中,是 2025–2027 年量产机型的实用选择,但在强泛化能力上受到显式规划层的限制。
9.3 关节技术迭代路径
从宏观历史看,人形机器人关节执行器经历了液压驱动(波士顿动力早期 Atlas,高力矩密度但系统复杂)→ 串联弹性驱动(SEA,柔顺控制,适合安全协作但带宽较低)→ 无框电机+减速器(当前主流,轻量紧凑)→ 线性行星滚柱丝杠(特斯拉/Figure 系列,高效传动)的演进路径,每次迭代的核心驱动力是提升力矩密度(单位重量/体积产生更大力矩)、降低系统复杂度和提升控制带宽。
当前 2025–2026 年,主流量产机型的关节方案出现了明显的路线分化:旋转关节主导型(宇树 H1/H2、优必选 Walker S1、傅利叶 GR-1)采用无框力矩电机+谐波减速器的旋转关节,结构紧凑、供应链成熟(绿的谐波为国产龙头),适合中国当前的零部件生态;线性驱动主导型(特斯拉 Optimus Gen 2/3、Figure 02/03)采用无框电机+行星滚柱丝杠的线性执行器,结构简洁、腿部运动效率较高,但高度依赖行星滚柱丝杠的供应链成熟度(当前仍是国产化最薄弱环节)。两条路线无绝对优劣,分野本质上是供应链成熟度与运动控制架构偏好的交叉结果。
9.4 新材料与结构轻量化
碳纤维复合材料(CFRP)、铝合金精密压铸、钛合金 3D 打印和高分子工程塑料是人形机器人结构轻量化的四大材料方向。CFRP 在骨架结构件(大腿骨架、小腿骨架、躯干主承力梁)中的应用比例逐年提升,宇树 H2 和 Figure 02/03 的骨架已大量采用 CFRP,在同等刚度下比全铝合金方案轻约 30%。
铝合金一体化压铸(High-Pressure Die Casting,HPDC)在关节外壳和结构连接件方向有广泛应用,与汽车一体化压铸(特斯拉 Gigapress)技术同源,拓普集团和文灿股份的技术能力正在向机器人零部件延伸。3D 打印钛合金件(选择性激光熔化,SLM)在样机和定制零件中广泛应用,批量制造阶段将逐步被精密铸造和压铸取代。
9.4b 仿生腿足结构与步态控制技术
人形机器人的双腿步行控制是工程界持续攻关的核心难题。人类行走本质上是一种受控跌倒(Controlled Fall)——每一步都是将重心推出支撑多边形的过程,依靠腿的快速摆动来接住即将"跌倒"的躯干。将这一复杂的动态平衡过程用机器来复现,需要解决以下核心工程问题:
全身动力学控制(Whole-Body Control, WBC):WBC 是当前人形机器人步行控制的主流技术框架,其核心思想是将全身 N 个自由度的运动视为一个统一的动力学优化问题,同时满足:浮动基座(飘浮在空中的躯干)的运动约束、接触约束(脚与地面的接触力必须在摩擦锥内)、关节限位约束和任务目标(末端执行器轨迹跟踪)。WBC 以 500–1000Hz 的实时频率运行,每个控制周期内求解一个带约束的二次规划(QP)问题,对计算平台的实时性要求极高。宇树 H1/H2、逐际动力 CL-1 均采用了以 WBC 为核心的步行控制架构。
强化学习步态策略(RL Locomotion Policy):以 2023 年 ETH Zürich 的 ANYmal 和 2024 年 Berkeley 的 Agility 研究为代表,强化学习生成的步态策略在鲁棒性上显著超越了传统 WBC:机器人在完全没有见过的不规则地形(倾斜石块、随机弹跳垫、外力推拉)上展现出超越人类设计规则的自适应能力。宇树 H1 的"野外行走"能力正是基于强化学习训练的步态策略,在深圳南山区的非平整公共道路上完成了超过 10km 的无跌倒行走测试。
零力矩点(ZMP)与最优控制:ZMP(Zero Moment Point)是传统人形机器人步行控制的经典理论框架,通过在每一步保证 ZMP 落在支撑多边形内来维持准静态稳定行走。ZMP 控制在平整地面上稳定可靠,但在非平整地面或受到外力干扰时鲁棒性有限,是早期(2000–2015 年)人形机器人(如本田 ASIMO、索尼 QRIO)的主流方案。
全接触运动规划(Contact-Rich Motion Planning):这是当前步行控制研究的前沿方向,目标是让机器人不仅能行走,还能主动利用环境特征(台阶边缘、墙面、栏杆)进行攀爬、翻越和借力操作,大幅提升机器人在复杂环境中的运动能力上限。
步行速度和能效是当前全双足人形机器人的两大量化指标。在速度上,宇树 H1 最高行走速度约 3.3m/s,Figure 02 约 1.5m/s(偏保守,工业场景优先安全),Atlas Electric 约 4m/s;在能效上,宇树 H1 在 2m/s 持续行走时的功耗约 600–800W,续航约 2 小时(约 14.4km 等效步行距离)。提升能效的关键技术方向是被动动力学设计(利用弹性储能元件在步行周期中回收和释放机械能,减少主动驱动功耗)和步态优化(找到能耗最低的速度-步态组合点)。
9.5 灵巧手关键技术细节
灵巧手的技术演进路径聚焦于三个维度的同步提升:自由度(DOF)、触觉感知密度和末端执行器的对象适应性。
当前高端量产机型的灵巧手 DOF 约为 16–22 DOF。Figure 02/03 的手部 16 DOF 采用连杆+微电机方案,每只手约 500g,能够操作从金属冲压件到包装袋的各类物体,在 BMW 工厂验证了持续 10 小时的操作可靠性。宇树 H2 将手部 DOF 提升至 20+ DOF,引入了局部力控(每个手指独立力矩控制),有效提升了对形状不规则物体的抓取鲁棒性。
对于 2026–2027 年的灵巧手技术演进,业界的共识预测是:DOF 提升至 24–28 DOF(接近人类水平),触觉传感密度突破 1,000 points/cm²,单只手重量控制在 400g 以下(轻量化碳纤维外壳+微型电机),以及实现"任意形状物体"的零样本抓取(通过具身大模型的几何推理能力而非预编程抓取姿态库)。这一能力一旦实现,灵巧手的应用范围将从"已知形状物体"扩展到"任意形状物体",直接解锁电商仓储(高 SKU 多形状产品)和食品制造(不规则形状农产品)等当前受限场景。
9.5b 中国具身大模型研究进展
中国学术界和产业界在具身大模型领域的研究进展,在 2024–2025 年出现了加速态势,值得单独梳理:
清华大学具身智能研究组是中国学术界在该领域最活跃的团队之一,聚焦于多模态具身感知(特别是视觉+触觉融合)和低样本任务泛化。团队在 2025 年发表了多篇被 NeurIPS、ICRA、ICLR 收录的高水平论文,成果被宇树、星动纪元等企业引用。
**上海人工智能实验室(OpenMMLab 生态)**在 2025 年推出了 RoboTwin 开放具身数据集和 GR1 开源具身基础模型,为国内具身 AI 研究提供了统一的基准和预训练权重。RoboTwin 数据集包含超过 50 种操作任务、500,000 条合成轨迹和 50,000 条真实遥操作轨迹,是目前中文社区最完整的具身 AI 公开数据集。
北京大学智能学院在世界模型(World Model)方向有重要进展,其 UniSim 工作(2024 年)展示了在虚拟世界中自监督学习物理常识的能力,为机器人的 Sim-to-Real 迁移提供了新的理论基础。
**北京智源人工智能研究院(BAAI)**发布了面向具身智能的多模态基础模型 Emu3-Body,采用统一的自回归架构同时处理语言、视觉和动作序列,是中国版本的 VLA 基础模型探索。
各整机厂的自研大模型进展:除智元 GO-1 外,宇树科技在 2025 年下半年发布了 UnifoLM(宇树全身控制大模型),专注于全身动力学控制和步行-操作的统一控制策略;优必选发布了 UniGraspBench,一个覆盖 100+ 种物体的通用抓取 benchmark,用于量化评估灵巧手抓取性能;傅利叶智能在康复外骨骼和人形机器人场景的人机协作 AI 上推进了"意图预测"(Intent Prediction)方向的研究——机器人能够预判人类下一步动作,提前准备协作姿态。
与国际前沿的差距量化:在具身 AI 最重要的开放 benchmark(如 CLIPort、RLBench、MetaWorld)上,2025 年中国学术团队的最高分与 Google DeepMind 和斯坦福的最高分之间差距约为 8–15 个百分点(具体取决于任务难度级别),这一差距在 2023 年约为 20–30 个百分点,两年内缩短近一半,显示出中国具身 AI 研究的追赶速度。在工业应用和产业化方面,中国已经超越美国(宇树等量产成功,Figure 也在追赶),但在基础模型能力上仍有差距。
9.6 训练数据采集与遥操作系统
具身 AI 的训练数据质量是制约当前所有具身大模型性能上限的根本瓶颈。与自然语言处理(NLP)不同,具身学习的训练数据(操作演示序列)无法从互联网直接获取,只能通过以下方式人工生成:
遥操作(Teleoperation)数据采集:操作员通过外骨骼手套、手柄或 VR 控制器实时控制机器人执行任务,同时记录所有传感器数据(图像、力矩、关节角度)和操作动作序列,生成高质量的示教轨迹。遥操作是目前最主流的数据采集方式,但效率低(每小时约 30–60 条有效轨迹,取决于任务复杂度)、成本高(需要熟练操作员),是具身 AI 训练数据的主要瓶颈。
合成数据生成:NVIDIA Isaac Sim + Cosmos 世界模型可以在虚拟环境中批量生成操作轨迹,速度比遥操作快约 1,000–100,000 倍。但合成数据存在 Sim-to-Real Gap(仿真与真实的物理差异),特别是接触力、材料变形和摩擦特性在高保真仿真中仍难以完全还原。NVIDIA 的 780,000 条合成轨迹辅助训练案例表明,高质量合成数据能有效补充真实数据,但不能完全替代。
人类视频数据的无监督利用:最前沿的研究方向是从互联网上的海量人类操作视频(YouTube 烹饪视频、工厂操作视频、DIY 视频)中提取操作知识,通过视频预训练模型学习"手-物交互"的物理规律,再迁移到机器人控制。这一方向理论上能解决数据稀缺问题,但视角差异、尺度变化和相机运动是主要挑战。
高效遥操作系统是具身 AI 数据采集的重要工具。国内具有代表性的遥操作解决方案:北京具身智能研究院(BIGAI)的全身遥操作套件、清华大学 RoboFleet 团队的双手遥操作外骨骼、多家初创公司开发的轻量化手部遥操作手套(基于 IMU 或光学追踪),已成为整机厂构建私有数据飞轮的必要工具。
9.7 具身 AI 的安全性与可解释性
随着人形机器人进入真实工厂和公共场所,具身 AI 的安全性(Safety)和可解释性(Explainability)成为工程实践中越来越重要的约束条件。
安全约束集成:当前主流做法是在具身大模型的动作输出端叠加基于规则的安全过滤器(Safety Filter),对模型生成的动作进行实时检查,过滤掉可能超出关节限位、碰撞预设危险区域或超过力矩阈值的不安全动作。但纯规则过滤器无法处理分布外的新型危险情况,更完善的安全保障需要将安全约束深度集成到模型训练过程中(如使用 Constrained RL 或 Safety-Aware Imitation Learning)。
可解释性的工程价值:在工厂场景,当机器人执行错误或损坏工件时,客户需要快速定位原因(是感知错误?规划错误?还是执行错误?),这要求 AI 系统具备一定的可解释性——能够为工程师提供"为什么机器人选择了这个动作"的中间推理过程。端到端(E2E)路线的主要工程批评之一就是可解释性差,这也是为什么工业落地的实际方案普遍倾向于保留模块化控制的分层架构,而非纯 E2E。
对抗性鲁棒性:在工厂和公共场所,机器人可能遇到故意干扰(恶意推击、物体放置在行走路径上)或意外干扰(工人不经意的碰触)。确保机器人在这类干扰下不会做出危险的反应动作(如大力推回、高速转动关节),是工业安全认证的基础要求,也是影响工厂客户采购信心的重要因素。
第十章 主要风险
10.1 具身大模型泛化瓶颈:最核心的技术风险
具身大模型的分布外泛化(Out-of-Distribution Generalization)是整个人形机器人产业当前面临的最核心技术风险。机器人在训练数据覆盖的任务和场景中表现良好,但在训练数据未覆盖的细微变化(物体颜色变化、光照条件改变、工件形状轻微不同)下,错误率显著上升,甚至完全失败。这一问题直接制约了工业人形机器人的"场景迁移成本"——每新增一个工位(即使是同类型任务),仍然需要大量的数据采集(100–500 次示教)和模型微调(数天),导致经济账难以覆盖中小型客户。
风险量化:如果泛化瓶颈无法在 2027 年取得实质性突破,则 2027–2028 年的工业人形机器人采购规模可能仅为当前乐观预测的 30%–50%。客户在完成首批 POC 后,若无法以低成本迁移到新工位,将面临采购决策的"场景覆盖率不足"困境,导致重复购买意愿低。
缓解路径:NVIDIA Cosmos 世界模型(合成数据生成效率提升 1,000×)、Figure Helix 的少样本泛化能力、Google DeepMind 的 OCTO/π0 模型研究是当前最有希望的缓解方向。但从学术研究突破到工厂级别可靠性的工程化落地,通常需要 12–18 个月的额外周期。
9.8 人形机器人的能源效率与可持续性议题
随着人形机器人大规模部署进入议程,其能源效率(每完成单位工作量消耗的能量)和全生命周期的可持续性,成为工厂客户和政策制定者越来越关注的议题。
能源消耗基准:全尺寸人形机器人在正常工作状态(行走 1.5m/s + 双臂轻载操作)下的功耗约为 800–1,500W,相当于一个从事中等强度体力劳动的工人的代谢功率(约 200–400W)的 2–5 倍。这一能源效率差距是机械-电气系统相对于生物系统的结构性劣势(人体利用化学能的效率约 25–30%,而电动机械系统整体效率约 65–80%),但随着无框电机效率提升、步态优化和被动储能机制的引入,预计 2028–2030 年全尺寸人形机器人的单位工作量能耗将降低约 30–50%,逐步缩小与人工的能源效率差距。
工厂电力成本影响:以一家部署 100 台人形机器人的中型汽车零部件工厂为例,100 台机器人的平均功耗约 1.2kW/台,全年 7,200 小时运行,总耗电量约为 864 兆瓦时/年,以工业电价 0.6–0.8 元/度计算,年电力成本约 51.8–69 万元。这相当于 10–14 名操作工年综合用工成本的总和,从能源成本角度来看,人形机器人的额外用电成本在经济账中占比不高,但在碳中和背景下,企业需要将这部分碳排放(约 480 吨 CO₂/年,取全国电网排放因子 0.556 kgCO₂/kWh)纳入碳账本管理。
生命周期可持续性:人形机器人的全生命周期碳排放包括:制造阶段(电机、减速器、电子元件的高碳制造过程,估计单台约 3–8 吨 CO₂当量)、运行阶段(电力消耗带来的排放,约 30 吨 CO₂当量/5 年周期)和报废阶段(电池、电子元件的回收处理)。随着可再生能源电力比例上升,运行阶段的碳足迹将持续降低。电池回收是当前人形机器人可持续性的最薄弱环节,缺乏标准化的回收体系,大规模部署后的废旧电池处理将是一个不容忽视的环保挑战,需要整机厂和政策端提前建立完善的回收机制。
替代人工的环境影响:从系统性视角看,人形机器人替代高体力劳动岗位,同时带来工人健康和职业安全的正向效益(减少工伤事故和职业病发生率),以及工厂整体运营碳强度的潜在下降(机器人可以在无灯光、无空调的"暗工厂"环境中工作,大幅降低工厂照明和空调的能耗)。综合计算,人形机器人替代对工厂整体碳排放的净影响预计是正面的,这也与双碳目标框架下中国制造业减碳的整体方向一致。
10.0 风险全景概览
在深入分析各个具体风险之前,有必要从宏观层面建立一个系统性的风险全景框架。人形机器人产业在 2026–2030 年面临的风险可以按照"可能性 × 影响程度"矩阵分类如下:
高可能性 + 高影响(必须重点关注的核心风险):具身大模型泛化瓶颈突破延迟(发生概率约 60%,若延迟 2 年以上将导致 2028 年市场规模低于预期 40–60%);主要整机厂量产良率达不到目标 MTBF(发生概率约 50%,影响客户续购率);行星滚柱丝杠国产化 2027 年之前未能规模量产(发生概率约 40%,影响线驱整机成本下降节奏)。
中等可能性 + 高影响(需要跟踪监控的重要风险):特斯拉 Optimus 量产出现重大延迟(1 年以上)导致全球格局预期修正;中美地缘政治摩擦升级导致 NVIDIA 计算平台对华出口完全禁止;工厂场景人形机器人安全事故导致主要汽车主机厂暂停采购。
低可能性 + 高影响(尾部风险需要关注):具身大模型 2027 年实现强泛化突破(过于乐观的情景,但若成真,市场规模将大幅超出预期);中国人形机器人整机遭受美国贸易制裁(类似华为 5G 设备)导致出口全面受限;某款主流机型发生公开的严重安全事故(造成工人伤亡),导致整个行业监管趋严和市场信心崩溃。
低可能性 + 低影响(无需重点关注):单个整机厂的商业失败(已有充分竞争缓冲,不影响行业整体);某一非关键零部件的供应紧张(可替代方案多);外资整机厂进入中国市场(Figure AI 等进入中国需要合规本地化,短期冲击有限)。
这一风险框架的核心结论是:人形机器人产业最大的系统性风险不是技术层面的"做不到",而是时间节奏层面的"慢了多少"。关键技术突破(泛化能力、MTBF、成本)几乎肯定会在某一时间节点实现,投资者和企业战略的核心不确定性在于这些突破发生的具体时间窗口。这一认知对于评估当前高倍数估值的合理性、制定产能扩张节奏和资本市场的布局时机都有直接的指导意义。
10.1b 人机协作安全事故的预防与应对
随着人形机器人进入工厂产线,人机协作安全事故的预防机制和事故应对体系的建立,是整个产业实现规模化部署不可回避的工程课题。
当前主流安全防护方案:物理隔离栏(围栏高度 ≥ 1.8m,防止人员误入机器人工作区);速度/力矩双重限制(在人员可能进入的协作区,机器人速度限制在 150–250mm/s,关节力矩限制在 50%–70% 最大值);安全光幕和激光扫描仪(检测人员进入危险区域,触发立即停机);急停按钮(工作站周边布置多个物理急停,操作员可随时中断机器人动作)。
软件层面的安全机制:碰撞检测(通过关节力矩传感器检测到超出预期的外力,自动切换到阻抗控制模式,大幅降低与人体接触时的冲击力);奇异点回避(防止机器人运动到关节速度无限大的奇异位型,导致不可预测的快速运动);工作空间限制(在软件层面设定机器人可运动的三维边界,超出边界即触发急停);自我碰撞检测(防止机器人的各肢体相互碰撞,导致关节损伤和外力冲击)。
事故发生后的责任归因技术:人形机器人在工厂中发生意外时,黑匣子(操作数据记录)是事故归因的技术基础。当前主流的做法是在机器人控制系统中以 1000Hz 频率记录所有关节位置、速度、力矩和传感器数据,同时以 30fps 记录机器人视角视频,事故发生后可以通过数据回放重现事故经过。这一技术机制为事故责任归因(是感知错误、规划错误还是执行错误)提供了客观依据,也是整机厂向工厂客户提供"数据溯源服务"的重要增值能力。
国际经验参照:日本在工业机器人安全事故管理上有最丰富的经验(因其工业机器人保有量全球最高),其劳动安全卫生法(OSHA 等效)对工业机器人的安全认证、定期检测和操作员培训均有详细规定,为中国人形机器人安全法规的制定提供了参照蓝本。
10.2 量产良率与制造一致性
从样机到量产,人形机器人面临的工程挑战远比消费电子复杂:
高 DOF 关节的组装精度一致性:人形机器人拥有 30–60 个运动自由度,每个关节的装配精度(角度误差 < 0.1°、间隙 < 0.05mm)在批量生产中极难维持,是导致早期量产机型批次间性能差异的主要原因。当前头部企业的做法是引入视觉检测(AOI)和激光测量设备进行 100% 出厂关节精度检测,但检测成本较高,且纠偏工作高度依赖人工。
软硬件协同标定:每台机器人出厂前需要个体化动态标定(重力补偿、摩擦补偿、惯量辨识),目前这一过程高度依赖人工(每台约需 4–8 小时),是制约产能线性扩张的关键瓶颈。宇树在 H1 量产过程中开始引入半自动化标定流水线,但完全自动化仍需 1–2 年。
MTBF 与工厂实际要求的差距:工业场景目标 MTBF(平均故障间隔时间)为 5,000 小时(约 2 年不间断运行),当前主流量产机型的实测 MTBF 约在 500–2,000 小时,仍有显著提升空间。Figure 02 在 BMW 的 1,250 小时运行是当前商业部署最长的单次记录,其手腕电缆故障揭示了高频活动关节在工业环境中的耐久性挑战。
10.2b 软件缺陷与 OTA 安全更新的工程挑战
人形机器人本质上是一台运行嵌入式 AI 操作系统的高复杂度移动平台,软件缺陷(Bug)的危害在物理世界中比在数字世界中更严重:一个自动驾驶软件 Bug 可能导致汽车碰撞,而一个人形机器人运动控制软件 Bug 可能导致关节高速异常运动伤害旁边的工人。
当前量产人形机器人的软件架构普遍采用分层设计:底层嵌入式控制(实时操作系统 RT-Linux/FreeRTOS,负责关节级伺服控制,100Hz–1000Hz 更新频率)、中间层运动规划(ROS 2 + 自研规划器,10Hz–100Hz)和上层 AI 推理层(PyTorch/TensorRT,1Hz–30Hz)。这三层的耦合点是潜在的软件缺陷高发区,特别是当 AI 推理层生成的动作指令与底层运动学约束(关节角度限位、速度限制)发生冲突时,需要健壮的安全检查机制。
OTA 更新的安全性挑战:量产机器人需要定期通过 OTA(Over-the-Air)无线更新接收具身大模型的性能提升版本和安全补丁。与汽车 OTA 类似,机器人 OTA 面临:更新包完整性验证(防止恶意代码注入)、更新过程中的中断保护(防止更新失败导致系统无法启动)、多台机器人的分阶段灰度发布(先更新 5% 的机器人验证稳定性,再全量推送)。特斯拉在汽车 OTA 管理上积累的成熟工程实践,将成为其 Optimus OTA 体系的重要起点,而中国整机厂则需要重新建立这一能力,这也是 2026–2027 年整机厂软件工程投入的重要方向之一。
10.3 成本下探节奏与供应链风险
行星滚柱丝杠国产化延迟风险:贝斯特等企业能否在 2026–2027 年实现行星滚柱丝杠的批量稳定供货,是线驱人形机器人(特斯拉 Optimus 路线)成本下降最重要的单一因素。若量产延迟,将迫使线驱机型继续高价进口,影响整机成本下降速度,也可能倒逼更多中国整机厂放弃线驱方案转向旋转关节方案。
关键精密零部件依然高进口依存:除谐波减速器外,高精度磁编码器(依存度约 70%)、P4/P2 级精密轴承(依存度约 80%)、高精度 IMU(依存度约 60%)等精密传感器和支撑零件的进口依存度仍较高,是制造成本和供应链安全的潜在风险点。
汇率风险:人形机器人整机中一定比例的进口精密零部件以美元或欧元计价,若人民币对美元汇率出现较大波动,将直接影响整机成本结构和国产整机的出口竞争力。
10.4 安全责任与法律框架空白
人形机器人在工厂和公共场所的大规模部署带来了安全责任归属的新法律问题:当人形机器人在操作中发生意外(造成人身伤害、财产损失或生产安全事故),责任主体如何认定(整机厂 vs. AI 模型开发者 vs. 系统集成商 vs. 运营方)在全球范围内尚无明确法律框架。欧盟 AI Act 对高风险 AI 系统提供了初步框架,但关于"具身 AI 机器人造成人身伤害"的具体归责机制全球立法都处于空白状态。在安全责任框架明确之前,工厂端客户(特别是大型跨国企业)在采购决策中会要求整机厂提供更高的责任险和产品责任赔偿保障,增加了双方的合规成本。
数据安全与工厂场景的隐私问题:人形机器人在工厂作业时会采集大量的视觉和传感器数据,其中可能包含工厂的生产工艺数据、产品设计特征和生产节拍信息等工业核心秘密。如何确保这些数据不被整机厂或 AI 云服务提供商不当使用,是工厂客户的重要顾虑,也是人形机器人企业数据治理体系建设的重要方向。
10.5 地缘政治与科技竞争风险
美国出口管制的持续影响:NVIDIA H100/H800 及 Blackwell B100/B200 系列对华出口限制,直接增加了中国人形机器人企业在具身大模型训练基础设施方面的成本。国产替代算力(华为昇腾 910B/C/920、寒武纪 MLU 系列)在训练效率上与 NVIDIA Blackwell 仍有差距,但随着华为昇腾的持续迭代,差距正在收窄。
知识产权争端风险:宇树科技 IPO 招股书中已将国际专利纠纷列为重要风险提示事项,这预示着随着中国人形机器人企业出口规模扩大,与日本、美国和欧洲竞争对手之间的专利争端风险在上升。特别是在关节执行器设计(谐波减速器、行星丝杠)和具身 AI 算法领域,存在一定的专利重叠风险。
国际市场准入壁垒:部分国家和地区可能以国家安全为由对中国人形机器人产品设置市场准入限制,这对宇树等希望扩大海外出口的企业是一个中长期风险。
10.5b 资本市场过热与泡沫风险
人形机器人赛道在 2025–2026 年吸引了大量高估值融资,部分早期项目的估值倍数(EV/Revenue)已达到 50–100× 甚至更高,远超传统制造业估值区间。这一高溢价反映了市场对人形机器人长期市场规模的预期,但也带来了以下潜在风险:
估值泡沫传导风险:若具身大模型在 2027 年未能实现预期的泛化突破,部分以技术期权为主要价值来源的高估值企业将面临融资困难和估值大幅回调,可能引发行业整合(M&A 或关闭)浪潮。中国 2025 年全赛道约 200 亿元融资中,有相当比例是对 2–3 年内未能商业化的早期阶段项目的投入,这些项目面临的"死亡之谷"风险不容忽视。
产能过剩的早期信号:宇树、智元、优必选、傅利叶、众擎等主要企业 2026 年合计规划产能已超过 20 万台,而 TrendForce 预测的全年出货量约为 6.25 万台,意味着整体产能利用率可能仅约 30%。产能过剩在短期内会加剧价格竞争,虽然有利于下游工厂客户(购买成本降低),但会压缩整机厂的利润空间,并可能导致部分企业以不可持续的低价抢单,影响整体行业的财务健康。
IPO 后股价压力:宇树科技 IPO 估值约 420 亿元,若科创板上市后市场给予的静态 PE 倍数低于市场预期,将对二级市场投资者形成亏损,间接影响一级市场的融资估值参照体系。
10.6 应用场景闭环时间节奏误判
家庭服务场景预期过于激进是当前投资端最常见的误判类型。家庭服务场景(通用家政机器人)的技术要求远高于工厂场景:家庭环境高度非结构化(每个家庭的布局、家具和物品都不同);任务类型无穷多且难以预定义;安全要求最高(与脆弱的老人和儿童近距离交互);成本容忍度最低(家庭消费者的价格敏感度远高于工厂采购者)。任何对家庭场景 2027–2028 年爆发的预期均属过于激进。基于技术成熟度和经济账测算,家庭场景的规模化最早在 2030 年,更可能的节点是 2032–2035 年。
中小工厂渗透节奏:当前量产机型的场景迁移成本(每工位数天适配时间+百次示教)意味着,ROI 最优的部署场景是年运行时间超过 4,000 小时的高重复度工位,这将暂时限制人形机器人的渗透范围主要集中在大型工厂的标准化工位,中小型工厂的渗透需等待泛化能力的突破和整机价格的进一步下降。
第十一章 2026–2030 年趋势预测
11.1 出货量曲线与市场规模基准情景
结合各主要机构预测数据和行业实际进展,建立基准情景(Base Case)、乐观情景(Bull Case)和悲观情景(Bear Case)三种预测框架:
基准情景数据:
| 年份 | 全球出货量 | 中国出货量 | 中国均价(工业全尺寸) | 中国整机市场规模 |
|---|---|---|---|---|
| 2025(实) | 约 1.7 万台 | 约 1.44 万台 | 约 45 万元 | 约 15.5 亿元 |
| 2026E | 约 7 万台 | 约 6.25 万台 | 约 28 万元 | 约 140 亿元 |
| 2027E | 约 20 万台 | 约 16 万台 | 约 20 万元 | 约 320 亿元 |
| 2028E | 约 50 万台 | 约 40 万台 | 约 14 万元 | 约 560 亿元 |
| 2030E | 约 120 万台 | 约 100 万台 | 约 9 万元 | 约 900 亿元(整机口径) |
注:2030 年中国电子学会 8,700 亿元的市场规模预测包含了下游 RaaS 服务、系统集成和整机后市场服务等全口径,与上表仅计整机销售的口径差异显著。全口径市场规模估计 2030 年约 2,000–3,000 亿元(基准情景),高情景约 5,000–8,700 亿元。
乐观情景(Bull Case):技术突破提前——具身大模型在 2026–2027 年实现少样本场景迁移(< 10 次示教,1 天适配),叠加特斯拉 Optimus 2026 年如期达到 5 万台产量,2027 年全球出货量可能达到 30–40 万台,中国市场规模 2028 年突破 1,000 亿元(整机口径)。
悲观情景(Bear Case):技术和量产遇阻——主流机型 MTBF 迟迟难以突破 2,000 小时,行星滚柱丝杠国产化延迟至 2028 年以后,2026 年出货量可能仅达 2–3 万台(全球),价格下降速度放缓,整机市场规模 2026 年低于 50 亿元。
11.2 CR5 集中度与竞争格局演变
2025 年全球人形机器人整机 CR5 约为 75%(宇树约 32%、特斯拉内部约 15%、智元约 12%、优必选约 10%、Figure AI 约 6%),竞争格局仍处于高速变化阶段。
预计 2027 年,随着特斯拉 Optimus 开始面向外部客户交付,全球 CR5 可能调整为:宇树(约 20%)、特斯拉(约 18%)、智元(约 12%)、优必选(约 8%)、Figure AI(约 7%),总 CR5 约 65%,格局较 2025 年有所分散(特斯拉进入竞争但更多整机厂也在增量中保持份额)。
中国阵营整体的全球市占率预计从 2025 年的 84.7% 逐步下降至 2030 年的约 65–75%(随着特斯拉 Optimus 量产放量),但中国阵营的绝对出货量仍将保持高速增长。供应链成本优势使中国整机厂在 2027–2030 年保持价格竞争力,特别是在 10–20 万元的中低价格段,中国品牌将占据压倒性优势。
11.3 主流型号迭代路径
2026–2028 年各主要整机厂的型号迭代有以下可预见方向:
宇树:H2 成为 2026 年工业线主力机型;H3 预计 2027 年发布(目标:灵巧手 DOF 提升至 22+ DOF,MTBF 突破 3,000 小时,整机重量降至 45kg);G1 在 2026–2027 年降价至约 6–7 万元进一步扩大开发者生态;打造 H 系列(重工业版)和 G 系列(服务/开发版)双产品线。
优必选:Walker S1 量产验证后推出 Walker S2(目标:场景迁移速度提升 5×,续航延长至 5 小时,增加多机器人协同调度标准接口);主攻汽车工厂主力机型地位,2026–2027 年确立中国汽车工厂出货量第一的市场地位。
智元:远征 A3 预计 2027 年发布,进一步提升 GO-1 大模型在新场景的适应速度(目标:< 20 次示教,4 小时完成新工位适配);扩展轮式产品线至仓储物流市场,与 JD.com 深化战略合作,打造智元-京东联合仓储解决方案。
特斯拉:Optimus Gen 3 预计 2027 年亮相,引入对标 FSD V14 的机器人端到端控制系统,大幅提升开放场景适应能力(目标:无需额外示教即可在新工厂环境执行已学任务);Gen 3 的商业定价预计首次打入 30 万元以下(面向外部客户的商业价格)。
Figure AI:Figure 03 正式交付后推进 Figure 04 研发,定位进入除汽车外的第二个垂直行业(仓储物流或医疗辅助);同时探索 RaaS 商业模式在欧洲的推广(BMW 和 Mercedes-Benz 工厂的扩大部署)。
11.4 应用场景渗透节奏
第一级:工厂固定工位(2025–2028 年主战场)
关键特征是任务可精确定义、环境可控制、ROI 可量化。2026 年是第一轮规模化采购爆发的时间窗口:优必选 2.5 亿元大单率先打通主机厂采购路径,宇树 7.5 万台产能覆盖广泛需求,整机定价降至 20–30 万元触发中大型工厂的采购决策门槛。预计 2027 年底前,中国汽车和 3C 厂商工厂场景累计部署人形机器人超过 10 万台次(含试验部署)。
第二级:仓储物流(2026–2029 年快速成长期)
Agility Digit 的 RaaS 模式在 GXO 证明了仓储场景的商业可行性,推动国内 JD.com、顺丰、菜鸟等物流巨头加速布局。轮式人形(智元 A2-W、银河通用 Galbot G1)比全双足更快进入仓储场景(技术门槛更低、部署成本更低),2027 年国内仓储场景人形机器人累计部署量预计达到 3–5 万台。
第三级:商用服务(2027–2030 年稳步渗透)
高端服务场景(五星级酒店、大型会展、机场 VIP 区域)将持续扩大,但增速有限(场景数量天花板明确)。商用服务场景的关键突破点是自然语言交互能力的提升(目标:多轮对话、多语言、情景感知),预计 2027 年开始有规模化的酒店和机场集成订单(50–200 台批量)。
第四级:家庭服务(2030 年及以后)
2030 年之前,家庭场景不太可能出现超过 10,000 台/年的中国市场规模。2032–2035 年,若具身大模型在开放家庭环境中实现强泛化(< 1 次示教,任意新任务),叠加整机成本降至 5 万元以下,家庭场景将进入真正的规模爆发期,届时市场规模将超越所有工业应用场景之和。
11.3b 垂直行业深度渗透节奏
除汽车、仓储两大主战场外,以下垂直行业将在 2026–2030 年逐步出现规模化人形机器人应用,每个行业有其独特的渗透节奏和技术需求:
半导体制造(Fab):半导体晶圆厂的物料搬运(晶圆盒 FOUP 的跨区传送、耗材配送)在洁净室(Cleanroom)环境下面临人工成本高和洁净度要求严格的双重压力。人形机器人进入 Fab 的技术挑战:洁净室等级(Class 10/100/1000)要求机器人本体材料和表面处理满足超低粒子释放要求;高价值晶圆(每盒约 100–500 万元)的搬运对稳定性要求极高,错误成本极大。预计 2027–2028 年,以轮式移动底座为主的人形机器人将开始在洁净室外围区域(耗材仓库、AGV 维修区)试验部署,进入晶圆处理核心区域最早要到 2029–2030 年。
医疗手术辅助:手术机器人(以 Intuitive Surgical 的达芬奇系统为代表)是医疗机器人中技术最成熟的品类,但与通用人形机器人并不是一个赛道。人形机器人在医疗场景的早期落地更可能在:院内药品配送(从药房到病房)、手术室内器械传递(辅助手术护士递送手术器械)和病床旁患者辅助(协助护士翻身、移位)。优必选和傅利叶均在这一方向有布局,傅利叶的康复外骨骼积累使其在人机交互安全设计上有独特优势。
农业采摘:温室水果和蔬菜的采摘是一个高重复性、高劳动密集型的工种,季节性劳动力短缺在日本、荷兰和中国的高端温室农业中已经非常突出。温室采摘对机器人的核心技术要求是:在自然光照变化下的视觉感知(植物遮挡、光反射变化)、对柔性果实(草莓、番茄)的轻柔抓取(不损伤果实)和在行间狭窄通道的移动能力。这一场景的市场规模约 200–500 亿元(中国温室农业的劳动力市场规模),预计 2028–2030 年开始出现专为农业采摘设计的人形机器人产品(轻量化轮式底盘、农业环境防水防泥设计)。
酒店与养老服务:中国老龄化加速(2030 年预计 65 岁以上人口超过 3 亿人),养老服务人员短缺将成为严峻的社会挑战。人形机器人在养老场景的应用设想包括:陪伴对话(AI 交互,减少孤独感)、日常巡护(定时查房、药品提醒)和体力辅助(协助老人起身、转移)。然而,与老年人直接接触的服务安全标准要求极高,且老年用户的技术接受度需要较长时间培育,预计这一场景在 2030 年前不会形成规模化部署,更可能是 2032–2035 年的市场。
建筑工地:建筑工地的重体力作业(砌砖、抹灰、钢筋绑扎)是国内劳动力老龄化冲击最严重的场景之一,但建筑工地的高度非结构化环境(每个工地地形不同、作业内容多变)使其成为人形机器人最难落地的场景。粉尘、振动、非平整地面和恶劣天气是对机器人可靠性的严苛考验,预计 2030 年前难以出现规模化的建筑工地人形机器人部署。
11.4b 全球人形机器人贸易格局展望
2026–2030 年,人形机器人的国际贸易格局将随量产规模扩大而逐渐成型。当前贸易格局仍以"各国自研自用"为主(特斯拉美国自用、宇树少量出口、Figure 在 BMW 合同中主要提供给欧洲工厂),但随着价格持续下降和供应链成熟,出口将成为重要的增量市场。
中国整机出口展望:宇树科技已向超过 30 个国家出口 H1/H2,2025 年海外营收占比约 25%。随着价格降至国际市场有竞争力的区间(15–25 万元,约 2–3 万美元),中国整机的出口将加速,特别是面向东南亚(越南、泰国制造业升级需求)、日本/韩国(老龄化严重的制造大国)和中东(新兴制造业区)。但面向北美和欧洲的出口可能受到贸易政策限制,特别是在涉及关键安全基础设施时,部分西方客户对中国 AI 系统控制的工厂设备存在数据安全顾虑。
核心零部件贸易格局:谐波减速器、行星滚柱丝杠和无框电机的国产化提升,将把中国人形机器人供应链的价值更多留在国内,减少对哈默纳科、Exlar 等进口产品的依赖。与此同时,绿的谐波、汇川等国产零部件厂商也将随整机出口进入海外市场,有望在 2027–2030 年形成"整机出口带动零部件出口"的协同效应。
国际合作与联合研发:NVIDIA 在全球范围内与整机厂(含中国整机厂)的 Isaac GR00T 生态合作,是目前人形机器人领域中最重要的跨国技术合作框架。在算法层面,中国科研机构和企业通过 ArXiv 发表的具身 AI 论文数量在 2025 年已超过美国,中国在学术输出上的追赶速度使国际社会对"中国具身大模型能力差距可能比硬件差距更快缩短"有了新的认识。
11.4c 具身大模型技术路线的长期演进预测
2026–2030 年,具身大模型的技术路线将在以下几个关键维度上发生深刻演变,每一维度的突破都将直接改变人形机器人的市场边界:
规模扩展(Scaling)的边界:NLP 领域的"扩展律"(Scaling Law)——模型参数量和训练数据量增加,性能持续可预测地提升——在具身 AI 领域是否同样成立,是当前最重要的悬而未决的研究问题。初步证据(Google DeepMind 的 RT-X 多机器人多任务实验)表明具身 AI 中存在弱扩展律,但扩展效率远低于 NLP,且对"真实操作数据"的质量依赖程度远高于对"数据量"的依赖。预计 2026–2027 年,随着更多机器人部署、真实数据积累速度加快,扩展律在具身 AI 中的成立边界将逐渐明朗。
多模态感知融合的深度:当前最先进的 VLA 模型主要依赖 RGB 视觉输入,力觉(六维力传感器)、触觉(触觉皮肤)、本体感知(IMU + 关节编码器)的多模态融合仍然处于早期探索阶段。2026–2028 年,随着高 DOF 灵巧手(22–27 DOF)配备触觉传感器阵列,以及更精确的六维力传感器部署,具身大模型将逐步整合多感觉通道,形成更接近人类感知-决策闭环的多模态具身系统。这一进展将首先在"柔性物体操作"(布料折叠、电线整理)和"力度精细控制"(鸡蛋拿取、精密装配)等场景中体现出性能飞跃。
长时程推理(Long-Horizon Reasoning)能力:当前具身大模型的有效决策时间范围约为 1–30 秒(即机器人能够根据当前感知自主规划 30 秒以内的动作序列),超出这一范围的任务需要人工分解成子任务后分别示教。2027–2028 年,基于大语言模型的任务规划器(Task Planner)与底层技能执行器(Skill Executor)的深度集成,有望将有效决策时间范围扩展到 5–30 分钟,使机器人能够自主执行"取出螺栓、安装到指定位置、检查紧固程度"这类包含多个步骤的复合任务,而无需将每个步骤单独示教。
持续学习(Continual Learning)与遗忘抑制:在量产工厂场景,机器人需要在学习新任务的同时,保持对旧任务的记忆(灾难性遗忘,Catastrophic Forgetting,是当前深度学习模型的固有问题)。2026–2027 年,基于弹性权重固定(EWC,Elastic Weight Consolidation)和模块化专家架构(Mixture of Experts)的持续学习算法有望在商用机型中得到初步应用,使机器人能够在部署后通过持续的少量示教不断扩展技能库,而不需要从头重新训练整个模型。
跨机器人知识迁移:整机厂内多台机器人之间的经验共享——一台机器人学会了新任务,立即将模型更新下发给同型号的所有机器人——是加速整机厂内技能积累的重要机制。技术上,联邦学习(Federated Learning)和分层知识蒸馏(Hierarchical Knowledge Distillation)是实现跨机器人知识迁移的可行路径。预计 2026–2027 年,宇树和智元将推出"云端技能共享"服务——用户贡献的操作演示数据经过处理后,可以提升整个用户群体的具身模型性能,形成数据网络效应(Data Network Effects)。
通用与专用的平衡:长期看,通用具身大模型(一个模型处理所有任务)和专用技能模型(为特定任务场景精调的小模型)将共存于同一机器人系统中,形成"通用模型负责理解和规划、专用模型负责精确执行"的分层架构。这一架构类似于人类的"大脑皮层(创意和规划)+ 小脑(精确运动协调)+ 脊髓反射(自动化动作)"的分层控制机制,是实现"聪明且可靠"的人形机器人的最合理工程路径。
11.5 供应链关键路径
人形机器人出货量曲线和价格曲线的实际走向,高度取决于以下供应链关键路径节点:
节点一(2026–2027):行星滚柱丝杠国产量产——若贝斯特和恒立液压能在 2026 年底前实现月产超过 5,000 根的稳定供货,线驱整机的执行器成本将下降 30–50%,对整机价格的拉动效应最为显著。
节点二(2026–2027):高精度六维力传感器国产化突破——当前六维力传感器进口依存度仍高,若坤维科技、宇立仪器等国产供应商在 2026 年实现 ATI 同级精度产品的量产,传感器 BOM 成本将下降约 60%。
节点三(2027–2028):无框力矩电机专用磁编码器国产化——关节位置控制的精度天花板,国产化率提升后将同时带动关节精度和成本的改善。
节点四(2027–2028):灵巧手触觉传感器量产——灵巧手触觉感知国产化,将解锁精密电子制造和食品加工等高价值场景,是新增市场规模的重要触发条件。
11.6 投资者视角:如何评估人形机器人产业链机会
对于资本市场投资者而言,人形机器人产业链的投资机会既高度确定(行业方向明确、政策支持坚定、技术进步持续),又充满不确定性(泛化瓶颈突破时间难以预测、量产良率挑战难以量化、竞争格局仍在快速变化)。以下从价值链分层视角提供一个评估框架:
一线核心赛道(确定性最高):关节执行器供应商,特别是谐波减速器(绿的谐波、国茂股份)和行星滚柱丝杠(贝斯特、恒立液压)。这一赛道的确定性来自:人形机器人关节减速器的需求与整机出货量高度正相关(每台机器人 6–20 个减速器),国产化率持续提升带来的份额增长(哈默纳科份额让位),以及市场集中度不高(即使竞争加剧,龙头企业仍能保持较高份额)。绿的谐波 2025 年净利润翻倍是最有力的财务验证。
二线高弹性赛道(弹性大,但受竞争格局影响):无框电机(汇川技术、步科股份、雷赛智能)、六维力传感器(坤维科技等待 IPO)、视觉感知(奥比中光)。这一赛道的特点是:竞争格局更分散(多家国内供应商同台竞争),但受益于人形机器人整体出货量增长的弹性高。投资者需要区分"行业贝塔"(行业增长红利)和"公司阿尔法"(个体竞争优势),后者是区分高低回报的关键。
三线应用赛道(变现路径最长,但想象空间最大):整机厂股权(宇树上市前/后、智元未上市)和仓储/工厂应用系统集成商。整机厂的投资逻辑是:谁能在量产竞争中胜出,将获得"具身大模型+供应链+客户绑定"三重护城河的复合优势;系统集成商的逻辑是:随着整机厂将 AI 和硬件标准化,系统集成的价值可能从"稀缺品"转为"标准化服务",毛利率面临压力。
规避风险的赛道:早期阶段且无量产记录的整机初创企业(技术路线未经验证、资金消耗速度快、能否跨越量产鸿沟高度不确定);以及对人形机器人泛化突破过度乐观定价的高倍数估值企业(若泛化突破延迟,估值面临显著下修风险)。
关键监控指标:用于实时跟踪行业进展的关键数据指标包括:绿的谐波季度减速器出货量(量产景气度的领先指标);宇树/智元/优必选季度出货量披露(行业增长速度的直接指标);特斯拉 Optimus 年产量指引(全球格局变化的标志性指标);具身大模型泛化 benchmark 分数(技术进步速度的客观量化指标);主要汽车主机厂人形机器人采购预算(下游需求拉力的先行指标)。
11.7 人形机器人与其他前沿技术的交叉影响
人形机器人的发展并非孤立演进,而是与多个前沿技术方向深度耦合,这些交叉影响将在 2026–2030 年形成若干重要的创新共振点:
人形机器人与 AGI(通用人工智能)的关系:在 AI 研究界,人形机器人被视为"具身 AGI"的重要物理载体——一个真正的通用人工智能系统需要能够在物理世界中行动和学习,而不仅仅是在语言文本中推理。OpenAI 的 Sam Altman 曾公开表示,解决"物理世界中的通用任务执行"是通往 AGI 的关键路径之一。如果 AGI 在 2030 年前出现重大突破,其最重要的物理体现形式之一将是人形机器人。
人形机器人与量子计算:量子计算对人形机器人的短期影响有限(当前量子计算机尚不具备训练深度学习模型的能力),但在 2030 年后,如果量子机器学习(QML)取得实质性进展,可能加速具身大模型的训练效率,对部分需要大规模搜索的运动规划问题有潜在帮助。
人形机器人与脑机接口(BCI):Neuralink 和 BrainGate 等脑机接口技术的进展,使"思维直接控制机器人"成为长期可探索的方向。虽然这一方向在 2030 年前不太可能进入商用,但作为人机交互最终形态的研究方向,其潜在影响深远——最自然的人机协作形式,可能是人类用思维直接指导机器人完成复杂操作,而机器人提供精确的体力执行能力。
人形机器人与先进制造(AM):人形机器人的广泛应用将反过来改变制造业的工厂设计和工艺流程。当前工厂设计主要为人类工人优化(工位高度、走廊宽度、照明条件),引入人形机器人后,工厂设计将逐步针对"人机共存"优化——更宽的走廊(供机器人穿行)、更统一的货架规格(降低机器人感知难度)、更标准化的工件接口(减少机器人抓取多样性需求)。这一"工厂设计反向适配"将进一步降低人形机器人的应用门槛,形成积极的正反馈循环。
人形机器人与元宇宙/数字孪生:工厂的数字孪生(Digital Twin)技术——在虚拟空间中建立工厂的实时镜像——为人形机器人的"预编程验证"提供了重要工具:整机厂可以在数字孪生中对新工位进行大规模仿真训练,在物理部署之前大幅减少现场示教次数。NVIDIA Omniverse 和微软 Azure Digital Twins 是两大主流数字孪生平台,与 Isaac GR00T 训练框架的整合将成为 2026–2027 年的重要工程实践方向。
第十二章 总结与展望
2026 年的人形机器人产业,正站在一个可以用数字精确坐标化的历史节点。全球 1.7 万台的年出货量,已经超越了工业机器人在 2005 年前后的同期市场规模;宇树 H1 的 65 万元定价在两年内从 120 万元降了近半;Figure 02 在 BMW 工厂运转了 1,250 小时、支撑 3 万辆汽车生产——这不是概念演示,这是印在 BMW 量产记录里的数字。Agility Digit 在 GXO 仓库搬运了 10 万个料箱——这是人形机器人历史上第一个可以用货箱数量核实的商业规模事实。
这场量产浪潮的深层逻辑,是制造业成本曲线与人形机器人价格曲线的历史性交叉。当一台工业人形机器人的 5 年全生命周期运营成本低于雇用一名工人的 5 年综合用工成本(中国制造业约 60–90 万元),经济账就会触发替代需求的临界动力。当前中国主流工业机型的目标价格区间是 20–30 万元(2026–2027 年),叠加系统集成和维护成本,5 年总拥有成本约 35–60 万元,意味着 ROI 回收期约 2–3 年,已经进入可以打动工厂财务决策者的范围——特别是对于三班制连续运作的高价值工位。
三股力量决定了这场竞争未来五年的走向:
第一股力量,具身大模型的泛化能力上限,决定了人形机器人的市场边界。机器人今天能在 BMW 工厂完成金属冲压件定位,明天能否在没有事先示教的情况下完成电子接插件精密插拔,后天能否在家庭厨房完成食材处理,归根结底取决于具身大模型是否突破了"分布外泛化"的壁垒。NVIDIA GR00T、Figure Helix、特斯拉的 E2E 路线和智元 GO-1 都在冲击同一个技术天花板。2027–2028 年可能是这一壁垒出现实质性裂缝的关键窗口,届时工业场景的可覆盖工位数量和市场规模将出现非线性跃升。
第二股力量,中国供应链的国产化速度,决定了成本曲线的下降斜率。绿的谐波 2025 年净利润翻倍、贝斯特行星滚柱丝杠量产在即、汇川技术伺服市占率稳居国内第一——中国零部件厂商正在以 2–3 年一代的速度追赶国际水准,并且每追上一个品类,整机成本就向下走一个台阶。当谐波减速器、行星滚柱丝杠、无框力矩电机、六维力传感器全部实现规模国产化(预计 2027–2028 年),整机成本下降的速度将超出大多数机构的预测区间,直接推动中国工业人形机器人在全球市场以价格优势碾压竞争对手。
第三股力量,特斯拉 Optimus 的实际量产节奏,是全局结构变量。特斯拉停产 Model S/X、将 Fremont 产能转产 Optimus 的决策,是汽车工业史上最大规模的产线从"造车"到"造机器人"的单一转换。若 Optimus 在 2026 年达到 5 万台产量并开始面向外部客户交付,将同时改变:全球市场格局(美系大厂重新夺回量产份额,迫使中国整机厂加速降价)、全球供应链格局(带动更多中国零部件厂商进入特斯拉供应链,推动国产化加速)、以及整个行业对人形机器人商业可行性的信心阈值(特斯拉量产背书的市场教育效应)。反之,若 Optimus 量产遭遇重大延迟,则全球人形机器人市场的增长节奏将更多由中国阵营主导,中国整机厂将在 2026–2027 年获得更大的先发积累窗口。
天下工厂平台覆盖的 480 万家在产工厂中,汽车制造、3C 电子、精密机械三大行业合计超过 180 万家工厂,这些企业是未来 5–10 年人形机器人最重要的潜在采购群体。从工厂采购决策的角度看,供应商筛选效率是影响从 POC 到批量采购转化周期的重要因素——工厂采购负责人需要快速核实整机厂、零部件厂商和系统集成商的真实生产能力,而这正是在产工厂数据库平台的核心价值所在。
量产元年已至。技术的临界点、供应链的成熟度、资本的集结方向,已经在 2025–2026 年共同指向同一个坐标。未来五年的竞争,是速度的竞争(谁能最快将出货量打到 10 万台/年级别),也是精度的竞争(谁能最快让机器人在新工位上"无示教自运行"),还是成本的竞争(谁能最快把整机价格打到 10 万元以下)。三重竞争同时展开,共同构成了人形机器人"量产元年"之后最精彩的产业演变叙事。
数据来源
本报告内容基于以下来源综合研究与分析,所有数据均有对应文献支撑:
企业官方文件与公告
- 宇树科技股份有限公司科创板 IPO 招股书(2026 年 3 月,上交所 002178 申报文件,拟募资 42.02 亿元)
- 优必选科技 FY2025 年度报告(港交所 9880,营收约 16.2 亿港元)
- 苏州绿的谐波传动科技 2025 年半年度报告 / FY2025 年报(688017,营收 5.71 亿元同比增长 47.31%,净利润翻倍)
- 特斯拉 FY2025 Q4 财报及 2025 年投资者日材料(Fremont + Texas Optimus 生产计划)
- Figure AI 官方技术博客及宝马 Spartanburg 工厂部署公告(figure.ai/news/production-at-bmw)
- BMW 集团新闻稿(press.bmwgroup.com):Figure 02 在 Spartanburg 工厂完成 30,000+ 辆 BMW X3 生产支撑;宝马莱比锡工厂启动欧洲首个人形机器人量产部署
- 梅赛德斯-奔驰集团官方新闻(group.mercedes-benz.com):Apptronik Apollo 在柏林 MBDFC 工厂部署及梅赛德斯投资 4.03 亿美元 A 轮
- NVIDIA 官方新闻稿及技术白皮书:Isaac GR00T N1 发布(nvidianews.nvidia.com);Isaac GR00T N1 开放基础模型技术报告(research.nvidia.com/publication/2025-03_nvidia-isaac-gr00t-n1);780,000 条合成轨迹生成效率和 40% 性能提升数据
- Agility Robotics 官方公告:Digit 在 GXO 仓库完成 100,000+ 托盘搬运里程碑(agilityrobotics.com/content/digit-moves-over-100k-totes)
行业研究报告
- TrendForce 人形机器人市场季度追踪(2025 Q4 / 2026 Q1):2026 年中国出货量约 6.25 万台,增长 94%
- IDC《2026 年人形机器人商用落地研究报告》:六大场景规模商用进展
- 中国电子学会《人形机器人生态报告 2025》:出货 1.44 万台,规模化量产元年判断,2030 年市场规模约 8,700 亿元
- 华安证券《从科幻到现实:人形机器人行业 2025 年度策略》
- 高盛《全球人形机器人市场展望 2025》
- 工业和信息化部《人形机器人创新发展指导意见》(2023 年 11 月)
- 工信部 2026 年 1 月政策通知:《人形机器人与具身智能综合标准化体系建设指南》(拟发布)
媒体与资讯来源
- 36 氪《量产元年之后,中国人形机器人走向"价值战"》(2026 年)
- 虎嗅《宇树科技科创板 IPO 将于 6 月 1 日上会》
- 证券时报、上海证券报对宇树 IPO、智元融资、优必选 Walker S1 的深度报道
- 新浪财经《智元撞线 5,000 台》(2025 年 12 月)
- IEEE Spectrum、The Robot Report 对 Agility Digit、Figure 02 BMW 项目、Apptronik Apollo 的持续跟踪
- MIT Technology Review:NVIDIA GR00T N1 全球首个开源人形机器人基础模型报道
- Fortune:Figure AI 与 BMW 合作细节报道(2025 年 4 月)
产业链数据
东方财富、同花顺等平台绿的谐波(688017)、贝斯特(300580)、汇川技术(300124)、步科股份(603160)、双环传动(002472)FY2025 财务数据及行业研报
东方财富、同花顺等平台绿的谐波(688017)、贝斯特(300580)、汇川技术(300124)、步科股份(603160)、双环传动(002472)、中大力德(002896)、雷赛智能(002979)FY2025 财务数据及行业研报
数据截止日期:2026 年 6 月 4 日。本报告所有市场预测均为研究区间估算,不构成任何投资建议。