摘要与核心发现
二〇二五年,一个数字开始频繁出现在中国科技政策的顶层文件里:八大算力枢纽,一百七十四 EFLOPS,三百三十 EFLOPS,五千亿元产业规模。这些数字不是凭空而来的——它们背后,是无数台服务器在贵州山间的数据中心机房里日夜不停地运转,是内蒙古草原上架起的一排排机柜吞噬着风力发电的绿色电流,是深圳南山区某栋高密度机架里,一张华为昇腾 910C 加速卡在反复推理着某家金融机构上传的客户风险评估请求。算力,已经成为这个国家最重要的基础设施之一,与水、电、路、气并列,而且在增速上远超后者。
本报告对中国数据中心与 AI 算力行业进行系统性深度研究,覆盖 FY2025 全年数据与 2026 年一季度最新进展,聚焦四个核心市场(IDC 运营服务、AI 算力服务、AI 芯片、基础设施制造)及其产业链的完整版图。
核心发现摘要
中国数据中心与 AI 算力市场在二〇二五年合计规模约五千亿元人民币,其中 IDC 运营服务约一千五百亿元,AI 算力服务约两千五百亿元,国产 AI 芯片约一千亿元。全国在用标准机架数量突破一千二百五十万架,AI 智能算力规模约两百一十五 EFLOPS,同比增速接近四十%。
竞争格局方面,IDC 运营商阵营呈现两极分化:润泽科技净利润同比增长一百八十二%领跑行业,万国数据、世纪互联保持稳健增长,光环新网因商誉减值亏损七亿余元。AI 芯片方面,华为昇腾以约四十九%的出货份额占据国产绝对主导,海光信息营收突破百亿,寒武纪首次实现年度盈利,国产 AI 加速卡整体市场份额已达四十一%。
技术层面,液冷渗透率从约五%快速提升至约二十%至二十五%,三大运营商新建数据中心液冷渗透率超过二十六%。PUE 政策压力(新建数据中心强制 ≤1.3)将液冷技术的商业化窗口从"未来"拉进"当下"。东数西算八大枢纽算力占全国七成,内蒙古和林格尔节点以绿色算力指数全国第一领跑西部节点。
风险方面,NVIDIA GPU 出口管制(H20 在二〇二五年四月追加禁令)是最重要的外部变量,强制加速了国产替代但也带来短期算力紧缺;国产 GPU 工艺天花板(当前最先进量产约等效 7nm,落后台积电约两代)是中期最重要的技术约束;大模型商业化节奏不确定性是 AIDC 需求侧最重要的波动来源。
展望二〇三〇年,中国 AI 算力市场规模有望超过一点二万亿元,液冷渗透率突破五十%,国产 GPU 市场份额提升至六十%以上,PUE 1.2 成为全面普及的行业标准,中国 IDC 运营商在东南亚和中东的出海布局初见规模。
本报告以十二个章节展开,依次覆盖定义与产业链全景、全球格局、PEST 分析、中国市场规模、产业链拆解、重点企业分析、地理产业带、八大细分专题、技术演进、风险图谱、预测展望与研究结论,为政策制定者、产业投资者与行业从业者提供系统性参考框架。
第一章 定义与产业链:从机架到算力的完整图谱
数据中心,这个词在二〇一〇年代还只是 IT 部门的后台设施,到了二〇二五年,已经成为国家战略竞争的核心场域。从北京海淀的人工智能创业公司,到贵州乌蒙山深处的超大型机房,全球每一次大模型推理请求、每一笔金融实时清算、每一帧视频的云端渲染,都要经过某一个机架上的服务器算出来。算力,已经成为二十一世纪最重要的生产资料之一。
理解这个行业,先要把概念分层说清楚。
按规模分级:大型、超大型与边缘节点
数据中心依装机规模通常分为四档。小微型数据中心(面积低于五百平方米、机柜数量在十至一百架之间),主要服务于企业内部或本地化需求;中型数据中心(五百至五千平方米,数百至数千架机柜),是传统电信级托管的主力形态;大型数据中心(五千至两万平方米,机柜通常超过五千架),是互联网平台和云厂商的标配;超大型或"超算"数据中心(Hyperscale,面积两万平方米以上,机柜数万架以上),是谷歌、微软、阿里、腾讯、字节跳动这类超级平台专属的体量,近年来随着大模型训练需求爆发,国内智算中心也在向这一方向集中。边缘数据中心则是另一个极端——装机量极小,部署在靠近用户侧的城市边缘节点,专门承载低时延场景。
按用途分类:通用 IDC、智算中心与边缘计算
通用互联网数据中心(IDC)主要承载存储、网络、一般算力租用;智算中心(AIDC,AI Data Center)专门配备 GPU/NPU 集群,为大模型训练和推理提供算力;边缘计算节点则聚焦自动驾驶、工业实时控制、视频监控等毫秒级时延场景。这三种形态在商业模式上差异显著:通用 IDC 以机柜租用为主,收入稳定但单价低;智算中心以 GPU 小时为计费单位,客单价高出通用 IDC 数倍到十倍;边缘节点则多以算力服务包的形式打包销售。
按算力用途分类:训练算力与推理算力
大模型的生命周期分为两个阶段:训练阶段需要大量高精度浮点运算(FP16/BF16),对显存带宽要求极高,通常使用 NVIDIA H100/H800、华为昇腾 910B/910C 这类旗舰卡;推理阶段对单精度要求略低,INT8 甚至 INT4 量化即可满足大多数场景,更关注吞吐量与成本。这一区别直接影响了芯片选型、服务器配置和数据中心设计——训练数据中心对功率密度、互联带宽(NVLink/InfiniBand)的要求远高于推理数据中心。二〇二五年,随着大模型推理商业化加速,推理算力需求的增速已经超越训练算力,成为 IDC 扩容的主要驱动力之一。
按能效分级:PUE 梯队
PUE(Power Usage Effectiveness,电能利用效率)是衡量数据中心绿色水平的核心指标。PUE = 数据中心总能耗 / IT 设备能耗,理想值为 1.0(所有能量都用于计算)。中国国家发展改革委在二〇二四年七月发布的《数据中心绿色低碳发展专项行动计划》中明确:到二〇二五年底,全国数据中心整体上架率不低于六成;新建大型及以上数据中心的 PUE 不高于 1.3;国家枢纽节点内新建数据中心 PUE 不高于 1.25。这一政策刚性约束,把液冷技术的商业化窗口从未来拉进了当下。
产业链全景:一座机房背后的供应链
一座数据中心的建造涉及七个核心层级。最底层是土地与能源——地皮、电力容量批复、绿电供应,这是数据中心选址"东数西算"战略的根本逻辑,西部地区电力成本较东部低四成,风光发电资源丰富;第二层是土建与机房基础设施,包括防雷、抗震结构、防火分区,对应土建总包商和专业机房工程公司;第三层是电力系统,涵盖高压变配电设备、UPS 不间断电源、精密空调、柴油发电机组,这是数据中心投资中占比最高的单个品类,通常占总投资的三到四成;第四层是制冷系统,涵盖传统机房空调(CRAC/CRAH)、冷水机组、液冷设备(冷板式和浸没式),随着单机柜功率密度从 10 kW 向 30 kW、100 kW 跃升,液冷正快速取代传统风冷;第五层是**机架服务器,包含 CPU 服务器、GPU/NPU AI 服务器、存储服务器,这是近两年价值增长最快的环节;第六层是网络互联**,含高速以太网交换机、InfiniBand 适配器、光模块和光纤基础设施;最上层是软件与运营管理,DCIM(数据中心基础设施管理)系统、ITSM 平台、运维服务。
整个产业链的市场规模在二〇二五年合计超过五千亿元人民币,其中数据中心运营服务(含租金、电费、托管服务)约一千五百亿元,算力服务(GPU 云计算、算力租用)约两千五百亿元,AI 芯片(国产 GPU/NPU 加速卡)约一千亿元,剩余为网络设备、制冷、电源等基础设施。这条产业链的每一个节点,都是独立的百亿级市场。
在国内 480 万家在产工厂数据库里,围绕数据中心机柜、UPS电源、数据中心制冷、网络交换机等细分品类,分布着数以十万计的制造商、集成商和配套服务企业。一座智算中心从规划到投产,要协同数百家供应商,其产业链的长度和复杂度,不亚于一条汽车生产线。
第二章 全球格局:超大型平台主导,美欧领先中国追赶
二〇二五年,全球数据中心市场进入了一个结构性分化的新阶段:超大规模云服务商(Hyperscaler)的支出增速远超传统 IDC 运营商,AI 算力投资成为市场扩张最重要的单一动力,美国公司在芯片和云服务两端持续强化优势,而中国则凭借本土替代战略和庞大市场需求,走出了一条自主化的平行路径。
Equinix:全球第一大中立 IDC 运营商
Equinix(NASDAQ: EQIX)是全球最大的中立数据中心运营商,在六大洲七十余个市场运营超过二百六十座 IBX 数据中心,提供托管、互联和云交换服务。二〇二五财年,Equinix 全年营收在九十亿美元量级(各季度均超二十二亿美元,全年引导区间 92—93 亿美元),调整后 EBITDA 利润率维持在四十七%至四十八%区间。Equinix 的核心壁垒在于"网络效应":当足够多的云服务商、企业和网络运营商都在其数据中心互联,新入驻者的价值就会因为可接入的连接选项更多而放大,形成难以复制的生态锁定。
Digital Realty:以规模和批量租用见长
Digital Realty(NYSE: DLR)是另一家全球头部 IDC REIT,侧重大规模批量机架租赁(Powered Shell 和 Colocation),服务于 AWS、Google Cloud、微软等超大型云客户。其二〇二五年全年营收约五十八亿至五十九亿美元,同比增长约六至七%。第三季度营收达十六亿美元,同比增长约十%,调整后 EBITDA 八亿六千八百万美元,同比增长十四%。Digital Realty 在欧洲(法兰克福、伦敦、阿姆斯特丹)和亚太(新加坡、东京、悉尼)布局广泛,是亚太区大型企业外包数据中心需求的主要承接方。
AWS、Azure、Google Cloud:三朵云的算力军备赛
超大型云服务商的资本支出规模,在二〇二五年进入了历史性量级。AWS 母公司亚马逊的年度资本支出突破一千亿美元,其中数据中心基础设施投入占大头;微软在 AI 基础设施上的年度承诺超过八百亿美元;谷歌云的资本开支也维持在数百亿美元级别。这三家公司在全球的算力布局,直接定义了 GPU 服务器市场的需求格局——NVIDIA 每年出货的 H100/H200/B100/B200,大部分流向这三大云厂商。
NVIDIA:全球 AI 算力的皇冠
NVIDIA(NASDAQ: NVDA)在 AI 加速芯片市场的市占率超过八十%,Hopper 架构(H100/H800/H200)与 Blackwell 架构(B100/B200/GB200)的迭代速度令竞争对手难以追赶。二〇二五年,美国政府对华半导体出口管制持续收紧:H100/H200/B100/B200 全系禁止向中国出口,此前专为中国市场"阉割"的 H20 在二〇二五年四月也遭到追加管制,NVIDIA 随即宣布可能面临约五十五亿美元的库存和订单减记。这一政策转折,成为中国国产 GPU 替代加速的最直接催化剂。
CoreWeave:独立 GPU 云的崛起
CoreWeave(NYSE: CRWV)于二〇二五年三月在纽交所完成 IPO,成为全球规模最大的独立 GPU 云服务商。其商业模式是从 NVIDIA 大规模采购 Blackwell GPU 集群,再以"算力即服务"的形式按小时或多年合同出售给 AI 企业。二〇二五年三季度,CoreWeave 再创季度收入新高,已签署的多年合同积压额超过五百五十亿美元;与 Meta 签署一笔最高约一百四十二亿美元的多年合约,与 OpenAI 签署约六十五亿美元的扩展合约。CoreWeave 代表了 AI 时代 IDC 行业的新物种:它不托管企业 IT,只卖 GPU 算力,完全依附于 AI 大模型的商业化进程。
中国云服务商:阿里云、腾讯云、华为云、字节火山
中国的超大型云厂商在二〇二五年同样大规模扩张,但方向有所侧重:阿里云在全球化布局上加速,在欧洲、中东、东南亚建设新数据中心;腾讯云聚焦游戏、金融、医疗行业的私有云需求;华为云依托昇腾芯片自成生态,在政府和国央企客户中份额持续扩大;字节火山引擎则主要服务内部的 TikTok/抖音业务和外部广告主,但也逐步向第三方开放算力服务。
全球竞争格局的结构性变化
二〇二五年全球数据中心市场最显著的结构变化有三:其一,算力密度跃升——Blackwell GPU 单卡功率超过一千瓦,推动机柜功率密度从 10 kW 向 100 kW 以上跨越,传统风冷机房大规模改造升级迫在眉睫;其二,液冷从可选项变成标配——谷歌、微软在新建数据中心中全面引入液冷,在美欧主要市场液冷渗透率已超过二十%,并快速向三十%逼近;其三,能源成为新的竞争焦点——数据中心的用电量在二〇三〇年可能占全球电力总消耗的四%至八%,绿色算力(使用可再生能源的数据中心)正从 ESG 概念变成客户采购的硬性要求。
第三章 PEST 分析:政策与技术双轮驱动,风险与机遇并存
政策层面(Political + Regulatory)
中国数据中心行业的政策逻辑,在二〇二二年以来发生了根本性转变——从"管得住"(能耗管控、项目审批收紧)向"建得好"(东数西算、绿色算力、国产替代)转型。
"东数西算"工程是近年来最具战略意义的政策部署。国家发展改革委、中央网信办、工业和信息化部、国家能源局于二〇二二年二月联合批复,在全国布局八大算力枢纽节点(贵州、内蒙古、甘肃、宁夏、京津冀、长三角、粤港澳大湾区、成渝)和十大数据中心集群。其核心逻辑是:把大量计算密集型任务(批量数据处理、离线训练、数据存储)从电价高企的东部迁移到电力资源丰富、土地成本低的西部,东部则专注于对时延敏感的在线服务和实时计算。截至二〇二五年一季度,八大枢纽算力规模占全国总算力的七成以上,八大枢纽内的智能算力达一百七十四点一一 EFLOPS(FP32),占全国智算总规模的八十点八%。
PUE 政策压力同样是强制性的。国家发展改革委的文件明确要求,新建大型及以上数据中心 PUE 不高于 1.3,国家枢纽节点不高于 1.25,到二〇三〇年力争平均 PUE 降至 1.2 以下。这一约束直接将液冷技术从"可选"推向"必选"——单机柜功率密度超过 25 kW 时,风冷在物理上无法保障 PUE 达标。
经济层面(Economic)
人工智能大模型的商业化加速,是过去两年数据中心需求爆发的根本经济驱动力。从二〇二三年的"百模大战"到二〇二五年的"推理算力紧缺",中国 AI 行业经历了一轮快速迭代:训练阶段的大规模投入逐步向推理侧转移,以 DeepSeek、通义千问、文心一言、豆包为代表的国产大模型在中国政企市场快速渗透,带动对国产算力基础设施(昇腾 910B/910C、天数 AI、寒武纪、海光 DCU)的需求急剧上升。
据智研咨询估算,二〇二五年中国数据中心(含算力服务)市场规模突破三千亿元,预计到二〇三〇年有望超过一点二万亿元,复合年增长率超过二十五%。GPU 服务器市场规模在二〇二五年突破九百亿元,同比增速接近七十%。
社会层面(Social)
数字经济对全社会渗透加深,带来多维度的数据中心需求:一是政务数字化——国家数据局在二〇二四年正式挂牌后加速推进政府数据统一上云,要求各级政务平台向国家算力网迁移;二是金融 AI 化——银行、保险、证券机构将大量风控、客服、投研场景接入 AI 大模型,对私有化算力部署需求显著上升;三是工业互联网——制造业"智改数转"推进,工厂侧产生的海量传感器数据对边缘算力和近源存储形成新的需求;四是视频与内容——短视频、长视频、直播平台的 AI 推荐和内容审核大规模使用 GPU 资源。
技术层面(Technology)
技术演进是数据中心行业最快变量。在芯片层面,Transformer 架构对并行矩阵运算的极端依赖,使 GPU/NPU 从辅助处理器升级为主力计算单元,Chiplet 封装技术正在突破单颗芯片的功耗和良品率瓶颈,HBM(高带宽内存)成为顶级 AI 芯片的标配,SK 海力士、三星、美光争夺 HBM3/HBM3E 的供应份额;在冷却层面,单机柜功率密度从 10 kW 向 100 kW+ 跃迁,浸没式液冷(将服务器直接浸泡在绝缘冷却液中)和冷板式液冷(在 CPU/GPU 冷头上循环冷却液)成为高密度机房的标配方案,中国的曙光数创已经率先实现浸没液冷的大规模商业化交付;在网络层面,四百 G 乃至八百 G 光模块的规模量产,光通信成本快速下降,InfiniBand HDR/NDR 在 GPU 集群内互联中应用广泛;在软件层面,DCIM 平台对数据中心电力、散热、资产的一体化管理正在成为大型运营商的标配,AI 辅助的自动化运维(AIOps)正在取代大量人工巡检工作。
GPU 出口管制:最重要的政策外部变量
美国对华 GPU 出口管制是中国 AI 算力行业最重要的外部约束。H100、H200、B100、B200 全线禁运,此前专门为中国市场降规的 H20(算力约为 H100 的三分之一)在二〇二五年四月亦被追加管制,H20 的供应链彻底中断。这一变化对中国的影响是双面的:短期内确实加剧了头部大模型公司的算力紧缺;但中长期看,它强制性地加速了国产 GPU 替代进程——华为昇腾 910B/910C、海光 DCU、寒武纪 MLU590、沐曦 MetaX 等国产算力卡在二〇二五年的出货量均创历史新高,国产 AI 加速卡在中国市场的合计份额已达到四十一%。中国自主算力生态的成型,将是未来五年内最重要的行业变量之一。 一九九三年,全球第一个商业互联网服务提供商在弗吉尼亚州开张。那时候"数据中心"这个词还没有标准定义,所谓服务器房间,不过是几台工作站摆在一起、配一台空调、门口挂上"禁止入内"的牌子。从那一年到二〇二五年,三十二年间,数据中心完成了从无到有、从简陋到精密、从技术附属到战略命脉的蜕变。
在中国,这一蜕变的加速期发生在二〇一五年以后。彼时,阿里、腾讯的服务器规模开始以数十万台的量级递增,云计算从概念走向大规模商业应用,"互联网+"政策浪潮带动了企业 IT 基础设施的快速上云迁移。到二〇二二年,当国家正式宣布"东数西算"工程全面启动,数据中心行业的战略地位被提升到与"铁路、公路、水利"基础设施并列的位置。再到二〇二五年,随着大模型的爆发式商业化,数据中心从"存数据"升级为"算智能",从 IT 后台变成了 AI 时代最重要的生产车间。
定义的演变与行业边界
数据中心(Data Center)是一个物理设施集群,用于集中容纳、运行和管理计算机系统及其配套组件,包括服务器、存储系统、网络设备和必要的电力、制冷、安防基础设施。这个定义在过去十年已经无法覆盖行业的全貌——今天谈数据中心,实际上包含了三个相互交叠但各有边界的市场:
第一类是传统 IDC(互联网数据中心),核心商品是标准化机柜空间(以 1.75 英寸为一个机架单元"U",一个标准柜 42U)和带宽接入,服务于各类互联网企业和传统 IT 基础设施外包需求。这一类市场成熟、竞争充分,主要的商业博弈在于土地成本、电力成本和规模效应。
第二类是智算中心(AIDC,AI Data Center),核心商品是 GPU/NPU 算力时间(以 GPU·小时为单位),面向大模型训练、AI 推理部署、科学计算等高度计算密集型场景。AIDC 的单机柜价值是传统 IDC 的五至十倍,技术门槛、能耗需求和服务复杂度均远超传统 IDC。AIDC 是二〇二三年以来增速最快的细分赛道,也是整个数据中心产业链技术革新最密集的地方。
第三类是边缘计算节点(Edge DC),是在靠近数据产生源头(工厂、路口、医院、商场)部署的微型算力节点,以极低时延(< 5 ms)为核心竞争力,服务于工业控制、自动驾驶、视频监控、CDN 加速等不可集中计算的场景。单个边缘节点规模极小(通常一至数十台服务器),但节点数量极多,分布全国乃至全球。
按规模分级的技术特征
数据中心还有一套按规模分级的标准,与上述按功能分类的标准交叉存在:
超大型(Hyperscale)数据中心:面积通常在二万平方米以上,IT 机架规模在一万架以上,单座设施投资往往超过五十亿元,甚至高达数百亿元。全球超大型数据中心的建设主体几乎是超级平台(谷歌、微软、亚马逊、Meta、阿里、腾讯、字节)或极少数专业大型运营商(Equinix、Digital Realty、润泽科技)。超大型数据中心的设计逻辑是"工厂化"——像造汽车工厂一样模块化、标准化、高效率地建造和运营,以规模摊薄单位算力成本。
大型数据中心:面积五千至两万平方米,机架一千至一万架,总投资十亿至五十亿元,是第三方 IDC 运营商和大型云服务商的主流形态,也是"东数西算"政策布局的核心载体。
中型及小微数据中心:这类数据中心在数量上占绝对多数,服务于城市商业楼宇、政府机构、医疗机构、金融网点等,通常是租用楼宇内的专用机房,不属于独立园区。随着私有云和本地化 AI 部署需求上升,这类中小型机房正在经历一轮技术升级浪潮。
PUE 等级体系与绿色数据中心
中国政府和行业标准体系建立了较为完善的数据中心能效分级体系,以 PUE 为核心指标。能效最高的 A 级绿色数据中心(PUE ≤ 1.2)是"十四五"期间国家积极推进的目标形态,主要依托液冷技术、高效变配电、自然冷却(如内蒙古冬季室外冷空气直接引入冷却)实现;B 级(PUE 1.2—1.4)是当前存量大型数据中心的主流水平;C 级(PUE > 1.4)的老旧数据中心,在国家政策的强制压力下正在面临强制改造或退出。
二〇二五年,中国在运营的数据中心中,PUE ≤ 1.3 的比例已从二〇二一年的约二十%提升至约四十五%,但大量老旧中小型机房的 PUE 仍在 1.5 至 2.0 之间,行业平均 PUE 仍在 1.46 左右,距"双碳"目标要求的 1.2 仍有较大差距,意味着行业在未来五至八年内仍将持续面临改造升级的压力与商机。
产业链全景的完整解构
数据中心产业链的复杂性,超出多数行业外观察者的认知。从一片荒地到一座运转中的智算中心,涉及的供应商数量通常超过五百家,采购决策的时间跨度长达两至三年。以下是一张更完整的产业链全景地图:
上游原材料层:包括钢铁型材(机柜骨架)、铜铝金属(散热片、冷板、配电铜排)、绝缘材料(机房地面、墙体、线槽)、光纤预制棒(光纤基材)。这些材料与其他行业高度共用,并无数据中心专用特性,是供应链中竞争最充分、附加值最低的环节。
基础设施设备层:包括数据中心机柜(标准机架、定制高密度机柜、开放式机架)、配电柜与 PDU(机柜列头柜、智能配电单元)、UPS不间断电源系统、柴油发电机组(备用电源)、精密空调(机房级空调)、液冷设备(CDU、液冷分配单元、冷却液泵)、数据中心综合布线系统(铜缆、光缆、走线架)。这一层的国产化率最近五年大幅提升,国内供应商在机柜、配电、线缆领域已接近全面本土化;精密空调和 UPS 领域外资(施耐德、艾默生、维谛)仍有一定份额,但国内的科华、科士达、英维克已经实现了主要品类的自主供货能力。
IT 核心设备层:包括AI服务器(GPU/NPU 服务器)、通用机架服务器(CPU 服务器)、存储设备(全闪存阵列、对象存储系统)、网络交换机(以太网核心交换机、叶脊架构)、光模块(400G/800G QSFP-DD)、高速光通信设备(DWDM 光传输设备)。这一层是数据中心产业链价值最高、技术壁垒最深的环节,也是中美技术竞争最激烈的战场——NVIDIA GPU、TSMC 晶圆、HBM 内存都在这一层,美国出口管制的主要打击目标也在这里。
软件与运营层:包括 DCIM(数据中心基础设施管理)软件、ITSM(IT 服务管理)平台、智能机房管控系统、自动化运维(AIOps)工具、CDN 内容分发网络软件、计量计费系统。软件层历来是数据中心价值链中毛利率最高的部分,但中国 IDC 运营商在软件产品化方面普遍较弱,倾向于自研后内部使用而非形成可售的商业产品。
服务层:包括机柜租用(Co-location)、服务器托管(Managed Hosting)、算力租用(IaaS/GPU Cloud)、网络互联(互联网交换、专线接入)、运维外包(人员驻场、7×24 值守)、咨询规划(数据中心建设咨询、迁移服务)。这是整个产业链直接面向终端客户的接触面,也是商业模式最多样、定价弹性最大的层级。
理解了这张产业链全景,就理解了为什么数据中心行业的市场规模数字在不同研究机构之间差异显著——不同的口径包含的产业链层次不同,覆盖 IT 设备本身的口径远大于只覆盖 IDC 运营服务的口径。本报告所采用的五千亿元总规模,是将 IDC 运营服务、AI 算力服务和国产 AI 芯片终端市场加总,不含国内通用服务器整体市场(若含则规模更大)。 Equinix 的护城河:网络效应与互联生态
要理解 Equinix 为何能在全球大型云厂商(AWS、Azure、Google Cloud 都有自建数据中心)的夹击下,仍然保持每年九十亿美元规模和四十七%以上的 EBITDA 利润率,关键是理解其"互联交换"(Internet Exchange)业务模型。
Equinix 的 IBX(International Business Exchange)数据中心,不只是出租机柜的地方,更是全球互联网流量的交换枢纽。当一家云服务商(如 AWS)、一家电信运营商(如 AT&T)和一家 CDN 服务商(如 Cloudflare)都在同一个 Equinix 数据中心里相互连接,这三方之间就形成了"私有互联"(Private Interconnection),数据在三者之间直接传输,绕过公共互联网,延迟更低、成本更便宜、安全性更高。当进驻 Equinix 的客户越多,每个客户能接入的互联对象就越多,提供的互联价值就越高——这是标准的网络效应,也是 Equinix 即便面对超大型云厂商的自建数据中心,依然有其不可替代性的根本原因。没有任何单一云厂商或电信运营商,愿意、也有能力在自己的数据中心里汇聚如此多元的网络和云服务商。
二〇二五年,Equinix 在全球运营超过二百六十个数据中心,托管逾一万家客户、超过四十五万个互联,这张互联生态已经自成体系,任何一家新进入者要复制这一规模,需要数十年的积累。Equinix 全年营收在九十亿美元量级,季度增速维持在规范化恒定汇率基础上的约五%至八%,是全球增速最稳健的大型数据中心运营商之一。
Digital Realty:批量租用的规模王者
与 Equinix 不同,Digital Realty 的商业模式更接近"工业地产"——为大型云服务商和企业客户提供大规模批量机柜空间(Powered Shell)和部分托管服务,单次合同规模通常在数十至数百万千瓦时容量,客户群体高度集中于 AWS、Google、微软、Oracle 等超大型平台。Digital Realty 在全球布局超过三百个数据中心,总 IT 容量约九千兆瓦,是全球 IT 容量最大的数据中心运营商。
二〇二五年全年,Digital Realty 营收约五十九亿美元,调整后 EBITDA 约三十四亿美元;三季度单季营收达十六亿美元,同比增长十%。新签约合同量(new bookings)在二〇二五年大幅提速,主要受 AI 相关超大型合同驱动——超大型客户需要数百兆瓦的新产能来支撑 Blackwell GPU 集群的批量部署,Digital Realty 是全球少数几家能在短周期内交付百兆瓦级新产能的运营商之一。其核心挑战是:批量租用模式对单个大客户的依赖度极高,若某个超大型客户因商业原因(资本支出收缩、自建产能增加)大幅削减采购,将对 Digital Realty 的空置率产生显著影响。
超大型云厂商的资本支出军备赛
二〇二五年的科技行业有一个标志性特征:头部云厂商在数据中心基础设施上的年度资本支出,从此前的几百亿美元量级跃升至千亿美元量级。
亚马逊在二〇二五年的资本支出计划超过一千亿美元,其中数据中心建设、服务器采购、光纤铺设是主要构成,AWS 正在全球同步扩张,在印度、日本、欧洲、澳大利亚的新区域(Region)相继上线,以满足本地化数据主权法规要求下的云服务需求。
微软在 AI 基础设施的年度承诺超过八百亿美元,其与 OpenAI 的战略绑定要求微软为 GPT 系列模型提供专用的 Azure 超级计算集群;同时微软在全球部署 Copilot 系列产品,Copilot 的每一次调用都转化为 Azure AI 基础设施的算力需求。微软与 G42(阿联酋)、与新加坡政府、与日本等多个市场的政府级 AI 合作,也正在推动其在这些市场大规模建设本地化数据中心。
谷歌在二〇二五年资本支出约七百亿至八百亿美元,TPU(张量处理器)v6 系列成为其对抗 NVIDIA GPU 的核心武器,谷歌在数据中心设计上的长期积累(包括软件定义网络 SDN、定制服务器架构、量子冷却实验)使其在运营效率上具有行业领先优势。
Meta 在二〇二五年宣布将全年数据中心投资提升至约六百亿至六百五十亿美元,并与 CoreWeave 签署了约一百四十二亿美元的多年算力合同,一边内部训练其 Llama 系列开源大模型,一边向外采购补充算力弹性。
这些数字的规模感是惊人的:仅 AWS + Azure + Google Cloud 三家,二〇二五年在数据中心基础设施上的合计投入就超过两千五百亿美元,相当于在一年内建设约二十至三十座三峡水电站的投资规模。这是 AI 军备赛对基础设施产业的直接映射,并将在随后三至五年通过设备采购、建设工程、能源基础设施等渠道,向全球供应链传导。
NVIDIA:AI 时代的基础资源控制者
NVIDIA 在 AI 算力市场的地位,用"制裁效应"来类比最为贴切——就像石油输出国掌控着石油供给,NVIDIA 通过掌控性能最强的 AI 芯片(H100/H200/Blackwell B100/B200/GB200),实际上掌控着全球最顶尖 AI 应用对算力的获取权。
从技术层面,NVIDIA 的护城河不只是芯片本身,更是 CUDA 生态——累计十七年、超过四百万开发者、数以万计的经优化 CUDA 库和深度学习框架的生态积累,使得从 NVIDIA GPU 迁移到竞争对手(AMD ROCm、英特尔 oneAPI、华为 CANN)需要付出远超硬件采购成本的软件适配成本。这种软件生态锁定,是 NVIDIA 能在 AMD、英特尔、Google TPU、Amazon Trainium 等竞争对手的持续冲击下保持八十%以上市场份额的核心原因。
Blackwell 架构是 NVIDIA 目前的旗舰产品线,其 GB200 NVL72 超节点(36 颗 Grace CPU + 72 颗 B200 GPU)代表了当前 AI 训练集群的性能天花板:单节点理论峰值训练算力约 1.44 EFLOPS(FP8),整个节点系统功耗约 120 kW,采用浸没液冷或冷板液冷。这个数字意味着:一座中等规模的智算中心(五百个 NVL72 节点),理论算力超过 700 EFLOPS,相当于中国全国当前 AI 算力总量的三倍以上,而这些都在几平方千米的园区内。
正是这个数字,推动了全球数据中心基础设施的一次范式迁移——从"为服务器提供机房"到"为机房提供能源和制冷"。当一台服务器节点要消耗 120 kW 时,任何按旧标准建造的数据中心(每机柜配 10 kW 供电和制冷)都不再适用,整个行业进入了被动的改造浪潮。
CoreWeave 的崛起:AI 时代的新型 IDC 物种
CoreWeave 成立于二〇一七年,最初只是一家挖以太坊的 GPU 算力公司。当以太坊在二〇二二年完成"合并"(从 PoW 转向 PoS,使 GPU 挖矿毫无用武之地)后,CoreWeave 做出了一个关键的战略转型——把全部 GPU 转向 AI 计算市场,向 AI 创业公司和大型科技企业出租 GPU 算力。
这一转型恰好踩在了 ChatGPT 带动 AI 爆发的起点,CoreWeave 在随后两年内从几乎没有外部融资,快速增长至超过十亿美元年收入、以一百九十亿美元估值完成多轮融资,并于二〇二五年三月在纽交所完成 IPO,成为美国 AI 基础设施领域规模最大的独立 GPU 云上市公司。
CoreWeave 的商业模式高度简单:大批量采购 NVIDIA Blackwell GPU(成为 NVIDIA 除超大型云厂商外的最大客户之一),以机架为单位部署在其自建或租用的数据中心内,以 GPU 小时为单位向 AI 客户出租,并提供 Kubernetes 集群管理和基础软件支持。其差异化竞争力在于:相比 AWS、Azure、Google Cloud 这三朵大云,CoreWeave 能够提供更低的 GPU 价格(因为它专注 GPU,没有通用 IT 的高运营成本分摊)、更快的新款 GPU 可用速度(CoreWeave 宣称是第一个提供 Blackwell 完整产品线商业服务的公司)和更灵活的合同架构(支持三年期大合同,稳定性好于按需计费)。
二〇二五年三季度,CoreWeave 收入达历史新高,与 Meta 签约约一百四十二亿美元,与 OpenAI 签约约六十五亿美元,合计积压订单超过五百五十亿美元,以三至五年的合同周期折算,对应超过百亿美元的年收入潜力。CoreWeave 的快速崛起,验证了一个产业逻辑:在 AI 时代,"算力即服务"可以是独立于云计算生态之外的商业模式,并具有极强的规模经济效应。
全球竞争格局的三个结构性特征
二〇二五年全球数据中心市场的竞争格局,可以用三个结构性特征概括:
特征一:美国主导芯片,中国主导制造。AI 算力最核心的组件(GPU 芯片、HBM 内存)的设计和最先进制程制造,仍集中在美国和台湾/韩国;但构成数据中心基础设施的绝大多数硬件(服务器机架、散热设备、综合布线、配电系统、光模块),中国制造商已经占据全球供应链的核心位置。这种"芯片垂直分工"格局是理解中美数据中心产业竞争的基础框架。
特征二:超大型平台垄断增量,独立运营商差异化生存。全球数据中心增量资产的主体,已从十年前的独立 IDC 运营商,转移到超大型云厂商(AWS、Azure、Google、Meta)。独立运营商要在这一格局中生存,必须找到超大型平台不愿意做或做不好的差异化价值:Equinix 的答案是互联生态(网络效应);CoreWeave 的答案是 GPU 专项服务;中国的润泽的答案是超大型私有化园区 + 长期稳定合同。
特征三:能源与土地成为新的战略资源。数据中心的选址决策在二〇二五年已经高度受制于电力容量批复——谷歌、微软正在为自建核能电站进行谈判;德克萨斯、弗吉尼亚的电力网络因数据中心需求激增而面临扩容压力;中国东部核心城市的电力容量批复冻结,倒逼了西部节点的快速发展。能源不只是运营成本,已经成为数据中心能否扩张的物理前提。 东数西算深度解析:八大枢纽的差异化定位
"东数西算"并非简单的"把服务器搬到西边",而是一个精心设计的区域分工体系,每个枢纽节点都有明确的功能定位和差异化战略:
贵州枢纽:以存储型、灾备型业务为主,依托贵州水电(绿电比例超过七十%)和年均温适宜的气候,优先承接银行存款数据备份、互联网历史数据归档等对时延不敏感但对可靠性要求极高的业务。苹果中国 iCloud 数据在贵安的存储,是这一定位最典型的案例。
内蒙古枢纽:以风电绿算为品牌,承接大规模 AI 训练任务(对时延最不敏感,对成本最敏感)和工业大数据处理,是当前绿色算力指数最高的节点,也是北京、天津企业"碳中和算力外包"的首选目的地。
甘肃枢纽:以庆阳为核心,重点发展电商、政务大数据、自动驾驶仿真训练等批处理业务,依托陇东煤电与光伏混合能源,电价相对低廉但绿电比例低于内蒙古。
宁夏枢纽:以中卫为核心,主打"绿色 + 低成本"定位,光伏与数据中心一体化是其特色,对金融行业数据库、政务云有一定针对性布局。
京津冀枢纽:以廊坊、张北、天津滨海新区为主要承载节点,服务于对时延有较高要求(但不是最严格要求)的业务,如互联网应用的非核心计算任务、大模型训练的部分 GPU 集群。京津冀枢纽受制于东部电力容量和环保约束,新建审批严格,存量资产稀缺价值高。
长三角枢纽:以长三角一体化示范区(青浦/嘉善/吴江)和长江沿线(南京、苏州)为核心,服务于对时延要求最高的金融、互联网、游戏业务,是 PUE 管控最严格的区域,已强制要求新建数据中心 PUE ≤ 1.25,液冷渗透率在全国各枢纽中最高。
粤港澳大湾区枢纽:以韶关为算力承载节点(避开珠三角高电价区),依托粤港澳的数字经济产业密度,主要服务于互联网头部(腾讯、华为、平安)和金融机构的私有云需求,以及跨境业务的数据合规处理。
成渝枢纽:以成都天府新区、重庆永川"中国云谷"为双核,依托四川水电和盆地冬暖夏凉的气候,是西南地区最重要的 AI 训练和大数据存储节点,也是西南工业互联网(汽车、半导体、新能源电池)数字化转型的算力保障中枢。
政策的第二层逻辑:算力网互通
"东数西算"的更深层政策目标,不只是物理分散建设数据中心,而是要构建一张"全国一体化算力网络"(National Computing Network),使分布在不同枢纽节点的算力可以像电力一样统一调度、按需分配。国家数据局于二〇二四年至二〇二五年密集推出的政策文件,反复强调"算力互通"、"算网融合"——即将跨节点的算力调度、数据流转、网络时延做到如同在同一个数据中心内操作的体验。
这一目标的技术实现,依赖于算力路由(Computing Routing)技术和低时延骨干网络(目前国家已规划部署"东数西算"专用骨干网,目标从东部到西部各枢纽的往返时延不超过二十 ms),以及统一的算力交易和计量标准(FLOPS 定价、API 调用计费的互通兼容)。若这一体系能在二〇二八年前基本成型,中国将拥有全球规模最大、调度粒度最细的国家级算力网络,这将是迄今为止人类历史上规模最大的计算基础设施统筹项目。
美国出口管制的完整时间线
美国对华半导体出口管制的逐步升级,是理解中国 AI 算力行业二〇二二年以后所有重大战略调整的核心背景线索。
二〇二二年十月,美国商务部发布临时最终规则,全面收紧对中国的先进计算芯片和半导体制造设备出口管制,H100 首次被纳入管制清单,中国企业通过正规渠道采购 NVIDIA 最新款旗舰 GPU 的路径正式关闭。
二〇二三年,为向中国市场提供可出口版本,NVIDIA 发布 H800(国内版,算力约为 H100 的七十%)和 A800(国内版),这两款"降规版"产品在一段时间内维持了 NVIDIA 对中国市场的供货。
二〇二三年十月,美国进一步更新管制细则,H800 和 A800 也被追加限制。NVIDIA 再次为中国市场开发更低算力的 H20、L20P 等版本(算力进一步降至 H100 的三十%左右)。
二〇二五年四月,特朗普政府宣布对 H20 也实施出口管制,中国企业通过正规渠道采购任何性能足以支撑大模型训练的 NVIDIA GPU 的通路,自此全面关闭。NVIDIA 宣布可能面临约五十五亿美元的资产和订单减记,涉及已生产但无法出口的 H20 库存。
这一时间线的意义是:出口管制是一个不断收紧的螺旋,每次中国找到"合规替代方案",美国就再升级管制覆盖该方案。这一动态告诉市场,任何依赖美国出口许可的进口高端算力方案,都只是临时性的,中国数据中心行业必须以国产替代为长期战略基础。
大模型应用对算力需求的结构性影响
大模型的技术特性决定了其对算力的需求结构与传统互联网完全不同。
传统互联网算力需求(搜索、推荐、广告)的特点是:请求量极大(每秒数亿次),单次计算量极小(毫秒级),算力分布高度均匀,适合大量普通 CPU 服务器并联处理。
大模型训练算力需求的特点是:运行时间极长(单次训练数周至数月),计算密度极高(需要连续不间断地进行大规模矩阵运算),对 GPU 集群的通信带宽要求极高(每个 GPU 需要频繁与其他 GPU 交换中间计算结果),单次失败成本极高(需要从最近的检查点重新开始,可能损失数天计算量)。
大模型推理算力需求的特点是:单次请求计算量远大于传统搜索(生成一段文本需要数百至数千次 Transformer 前向传播),但相比训练可以在单张或少量 GPU 上完成,更关注吞吐量(每秒能处理多少请求)和首字时延(用户输入后多久开始看到输出)。
这三类需求对数据中心硬件配置、网络架构、制冷方案的要求截然不同,也推动了 IDC 产业内部从"通用机房"向"场景专用机房"的加速分化。数据中心运营商如果不能提供差异化的"AI 推理专用集群"或"大模型训练专用集群",在 AI 时代的竞争中将很快被专业化运营商所取代。
第四章 中国市场规模:五千亿格局与三条增长曲线
总量:五千亿元的产业版图
二〇二五年,中国数据中心与 AI 算力产业的整体市场规模已跨越五千亿元人民币大关。这一数字由三个核心子市场构成:
第一,IDC 运营服务(数据中心托管、机柜租用、带宽、电力服务)约一千五百亿元。据智研咨询等机构测算,中国第三方 IDC 市场(不含运营商自建自用)在二〇二四年约三百亿至三百五十亿元,若含运营商 IDC 和政府数据中心,整体 IDC 服务规模超过一千五百亿元。市场上架率持续提升,二〇二五年全国在用标准机架数量突破一千二百五十万架(含智算机柜)。
第二,AI 算力服务(GPU 云租用、算力即服务、智算中心订阅)约两千五百亿元。这是增速最快的子市场,与大模型商业化进程直接挂钩。二〇二五年,国内主要云厂商(阿里云、腾讯云、华为云、百度云、字节火山)的 GPU 算力收入均实现三位数增长。第三方 AI 算力服务商(如智源、商汤科技、海光云算、瑞云科技)也在快速崛起,市场从寡头垄断走向多元竞争。
第三,AI 芯片(国产 GPU/NPU 加速卡终端市场,不含 NVIDIA 进口)约一千亿元。这一数字在二〇二三年还不足两百亿元,两年间翻了五倍,核心驱动力是华为昇腾的快速放量(出货量约八十一万张)和寒武纪、海光、天数、壁仞、摩尔线程等厂商的集体爆发。
上架率:从四十七%到六十%的政策硬约束
全国数据中心整体上架率是衡量行业有效供给的关键指标。国家发展改革委明确要求,二〇二五年底全国上架率不低于六十%。过去几年,受数据中心建设过热影响,部分地区(尤其是内蒙古、宁夏等西部节点)出现了大量机柜建好但算力租用跟不上的"空转"问题。二〇二五年,随着东部大模型公司批量采购西部智算算力,西部节点上架率显著改善,贵州算力枢纽上架率从约三十%提升至约五十六%,内蒙古和林格尔节点在用算力规模达到五点零六万 P,其中智算占九十四%,接近满负荷运营。
IDC 机柜规模:从 970 万架到 1250 万架
二〇二三年末全国在用标准机柜约九百七十万架,二〇二四年末约一千零九十万架,二〇二五年前三季度即突破一千二百五十万架,全年预计超过一千三百万架,年增量约二百万架以上。其中,AI 智算专用机柜(功率密度 30 kW 以上)的新增量占全年新增的约四十%,普通 IDC 机柜(5—10 kW)的新增绝对量持续但增速放缓。
AI 算力规模:174 EFLOPS 与 40% 增速
国家数据局等部门发布的数据显示,二〇二五年一季度,全国总算力规模(含通用算力、AI 算力、超算算力)超过三百三十 EFLOPS(FP32),其中 AI 智能算力规模约二百一十五 EFLOPS,同比增长接近四十%。东数西算八大枢纽内的智能算力达一百七十四点一一 EFLOPS,占全国智算总量的八十点八%。预计到二〇二七年,全国 AI 算力规模将突破一千 EFLOPS。
三条增长曲线的分化
观察近五年的市场数据,中国数据中心行业实际上在沿三条速度不同的增长曲线演进:
增速最慢(CAGR 约 10—15%)的是传统 IDC 存储和通用算力,这部分业务成熟度高,竞争充分,价格已相当透明;增速居中(CAGR 约 25—30%)的是云计算基础设施租用和私有云建设,这部分与政府数字化、企业上云政策密切相关;增速最快(CAGR 超过 50%,部分赛道达到三位数)的是 AI 算力服务,包括大模型训练算力、推理 API 服务和 RAG(检索增强生成)知识库服务。
区域竞争格局:东部供不应求,西部加速追赶
从地域分布看,北京、上海、广州、深圳、杭州等核心一线城市因土地稀缺和电力容量受限,数据中心新建审批极为严格,存量资产价值不断攀升,供不应求态势持续;廊坊、张北、昆山、嘉善等紧邻一线城市的卫星节点承接了大量外溢需求;西部的贵州、内蒙古、甘肃、宁夏则依靠成本优势和"东数西算"政策红利,吸引了字节、阿里、腾讯、百度等互联网巨头的大规模投资,但网络时延(从北京到贵阳约 35—50 ms)仍是制约时延敏感型业务迁移的瓶颈。
第五章 产业链拆解:从土地到服务的八个价值层
数据中心是一个高度集成的复杂系统,其产业链横跨建筑、电气、机械、电子、软件、运营多个学科门类。理解这条产业链的每个节点,既是理解整个市场竞争格局的前提,也是识别投资机会的路径图。
第一层:土地与能源
数据中心的选址决定成本结构的上限。一座大型数据中心每年的电费支出通常占运营总成本的六十%至七十%,因此电价是选址最核心的变量。贵州、宁夏、内蒙古工业用电价格在每千瓦时 0.25—0.35 元之间,北京、上海、广东则在 0.65—0.80 元区间,相差近两倍。"东数西算"工程的本质,就是通过政策导向,将大量可以异地计算的任务迁移到电费低廉的西部,把东部腾出来的电力容量留给时延敏感的高价值计算。
绿电供应是二〇二五年新出现的选址决定性因素。国家要求重点区域数据中心绿电占比到二〇三〇年不低于七十%,贵州水电、内蒙古风电、甘肃光伏已经与当地数据中心园区打捆供应,形成"绿色算力"品牌效应,吸引了对 ESG 有要求的跨国客户和金融机构。
第二层:土建与机房基础设施
数据中心机房的土建并非普通建筑——它需要达到防火、防水、防尘、抗震(9 度抗震设防)等严格标准,机房楼板承重通常要求 12—16 kN/㎡(普通写字楼仅 2—4 kN/㎡)。机房的静电地板、防雷系统、密封冷通道设计,都需要专业化的机房工程集成商参与。国内主要玩家包括英维克、维谛技术(Vertiv)、施耐德电气中国和科华数据等。
第三层:电力系统
电力系统是数据中心造价和运营成本最大的单一系统,通常占 IDC 建设总投资的三成至四成。其核心组成包括:
高压变配电:主要供应商包括施耐德电气、ABB、国内的正泰电气、天正电气。数据中心通常采用"2N"或"N+1"冗余配置,确保任何单点故障不影响运营。
UPS不间断电源:这是保障服务器在市电断电后持续运行的最后一道防线,通常能支撑 10—20 分钟,等待柴油发电机启动。国内主要厂商有科华数据(002335)、科士达(002518)、中恒电气(002364)、易事特(300376),国际品牌有施耐德电气和艾默生。
配电柜与列头柜:配电系统在机柜侧最终通过列头柜(PDU)将电力分配到每台服务器,高密度 GPU 机柜要求单路配电容量超过 60A。
柴油发电机组:作为备用电源,是大型数据中心的必备设施,通常按照 N+1 冗余配置,每台功率在数百千瓦至数兆瓦量级。
第四层:制冷系统
制冷是 PUE 的决定性环节,是最近几年技术变革最剧烈的单个模块。
传统风冷:通过机房精密空调(CRAC/CRAH)和冷水机组循环冷却,依靠通道隔离(冷通道/热通道封闭)提升效率,适用于单机柜功率密度低于 20 kW 的场景。国内主要厂商有英维克、华为数字能源、海信商用空调、国祥制冷。机房空调市场已经相当成熟,但面临液冷的快速替代压力。
冷板液冷:在 CPU/GPU 散热冷头上安装液冷板,通过循环水(或冷却液)带走热量,适用于单机柜功率密度 20—80 kW 的场景。冷板液冷改造成本相对较低,与现有机房基础设施兼容性好,是当前 AI 服务器散热的主流方案。曙光数创、高澜股份、申菱环境是国内头部供应商。
浸没液冷:将服务器整机浸泡在绝缘冷却液(通常为氟化液或矿物油)中,散热效率最高,PUE 理论上可低至 1.03,是单机柜功率密度 80—200 kW 以上场景的终极解决方案。但改造成本高(含液冷液的费用),系统复杂度大,服务维护难度高,目前主要应用于超算和最高密度 AI 训练集群。国内曙光数创(872808)在浸没液冷技术上处于领先地位,是字节跳动、腾讯的核心供应商。
截至二〇二五年,中国数据中心液冷渗透率从二〇二三年的约五%提升至约二十%至二十五%,三大运营商的新建数据中心液冷渗透率已超过二十六%。按照当前趋势,二〇二七年全国液冷渗透率有望突破四十%。
第五层:服务器(CPU + GPU/NPU + 存储)
服务器是数据中心价值密度最高的单个设备品类,也是 AI 时代增速最快的环节。
AI 服务器(GPU 服务器):浪潮信息(000977)是中国最大的 AI 服务器制造商,二〇二四年实现营收一千一百四十七亿元,同比增长七十四%,其中 AI 服务器(JovaMES 系列)出货量全球第一;中科曙光(603019)前三季度营收八十八亿元,同比增长近十%;紫光股份(000938,含新华三)前三季度总营收七百七十三亿元,在超融合和企业私有云市场占据重要份额;工业富联(601138)的 AI 服务器(GoServer 系列)则是全球超大型云厂商的重要 ODM 供应商。
存储服务器:华为、紫光股份、联想、忆联(未上市)是国内主要玩家,全闪存阵列和 NVMe-oF 网络存储在 AI 训练场景中需求旺盛。
第六层:网络互联
数据中心内部的网络互联,决定了 GPU 集群的训练效率。关键组成包括:
高速以太网交换机:400G/800G 以太网交换机是当前主流,国内的锐捷网络、新华三、华为正在快速追赶博科(Broadcom)等国际厂商的芯片级差距。
光模块与光纤:中际旭创(300308)、新易盛(300502)是全球领先的高速光模块制造商,其 400G QSFP-DD 和 800G 光模块大量出口至 AWS、Google、微软的数据中心。国内 AI 数据中心建设的加速,也带动了光通信设备和光纤的高速增长。
InfiniBand 适配器:Mellanox(已被 NVIDIA 收购)是 NDR(400 Gb/s)InfiniBand 的主要供应商,中国 GPU 集群对 InfiniBand 的依赖构成了一个潜在的供应链风险点,国内龙芯、中科曙光等公司有替代品在研。
第七层:软件与 DCIM
DCIM(数据中心基础设施管理)平台对电力、散热、资产、安防进行统一管控,是大型数据中心运营效率的关键工具。国际品牌有施耐德电气 EcoStruxure、维谛 VertivHQ,国内有华为数字能源、科华数据等自研平台。AI 运维(AIOps)正在被越来越多的数据中心运营商采用,用于预测设备故障、优化 PUE、自动化工单处理。
第八层:数据中心运营与服务
第三方 IDC 运营商的核心价值在于:规模采购降低电力和设备成本,专业化运维降低故障率,多客户分摊基础设施投资。运营服务包括机柜托管(Co-location)、算力出租(IaaS)、混合云管理、数据中心运营整体托管(Managed Service)。随着服务器托管向 AI 算力服务转型,运营商的技术门槛和服务能力成为核心竞争力,单纯"出租机柜"的模式已经面临降价和同质化压力。 中国 IDC 市场的五年成长曲线
从二〇二〇年到二〇二五年,中国第三方 IDC 市场的成长轨迹,是一条典型的政策 + 需求双轮驱动曲线。二〇二〇年,新冠疫情加速了远程办公和视频会议对 IDC 的需求;二〇二一年,"双碳"目标的提出推动老旧高 PUE 数据中心加速退出,新建数据中心审批收紧,存量资产价值抬升;二〇二二年,东数西算正式启动,西部新建数据中心的审批通道打开,但东部核心城市依然严格管控新建;二〇二三年,大模型浪潮开始,GPU 算力需求从个位数增速突变为三位数增速,一夜之间所有大型互联网公司都开始抢建或预订 AI 算力;二〇二四年,AI 算力需求确定性升级,AI 服务器采购金额超过普通 CPU 服务器,成为 IDC 行业最大的单一增量采购品类;二〇二五年,国产替代进程中的算力紧缺(H20 被管制后的真空期)阶段性加剧,国产 GPU 产能快速爬坡,市场从"有没有"进入"够不够用"的讨论。
IDC 上架率:隐藏在数字背后的结构矛盾
国家要求全国 IDC 上架率达到六十%,这一政策目标背后隐藏着复杂的结构矛盾。
首先,上架率是个全国平均数,掩盖了巨大的区域差异——北京、上海的优质 IDC 资产上架率普遍在九十%以上,供不应求;而部分西部新建节点(甘肃、宁夏)的早期项目,上架率可能只有三十%至四十%,严重依赖政策指配的迁移需求,而非自发的市场需求。
其次,"机柜"的统计口径变化带来了可比性问题——传统标准机柜按 2 kW 至 5 kW 计,而新建智算中心的"机柜"功率密度在 30 kW 至 100 kW,单架"机柜"创造的收入可能是传统机柜的十至二十倍,用"架数"作为度量单位,无法真实反映行业创造的经济价值。部分行业机构已开始以"MW(兆瓦)"或"IT 负载兆瓦"为核心度量单位,这一切换的意义,类似于从"计算机数量"切换到"FLOPS 算力",更能反映基础设施的实际经济价值。
第三,不同客户对上架率的定义也不统一——超大型云厂商通常要求数据中心按"N+1"冗余运营,也就是说,一座数据中心即便所有承诺机柜都被预订,实际 IT 负载仍可能低于设计容量的八十%(留有冗余保障),这也会在统计上拉低"上架率"。
AI 算力供需缺口与价格信号
二〇二五年 H20 被追加管制前后,中国 AI 算力市场出现了短暂但影响深远的供需缺口期。在缺口期内,以下价格信号清晰反映了市场的紧张程度:
公有云 GPU 租用价格(A100 等效算力)在缺口期价格一度涨幅超过三十%,排队周期从数天延长至数周;二手 NVIDIA H100/H800 的市场流通价在中国市场高出新加坡、美国同类货源的溢价约二十%至四十%;国产 GPU 算力(昇腾 910B 等效)的月租单价在缺口期实现了快速上涨,华为昇腾集群的排期普遍延长至三个月以上。
这一价格信号加速了国内 GPU 产能扩张的投资决策——多家国产 GPU 厂商(寒武纪、海光、天数智芯)宣布增加量产规模,主要 AI 服务器集成商(浪潮、曙光)也加快了国产 GPU 服务器的验证和出货速度。这一切都发生在约六个月的短暂时间窗口内,充分体现了中国制造业供应链对需求信号的高速响应能力。
政务算力:国家算力网的另一面
在市场化的 IDC 运营和商业 AI 算力服务之外,还有一个体量同样庞大但外界关注度更低的细分市场——政务算力。国家数据局、各省数据局推动的"政府数据统一上云"、"国家算力网"项目,正在将散落在各级政府机构内部机房的计算资源,逐步迁移整合到统一的国家或省级政务云平台。
这一迁移的体量估算:全国约有五十万家各级政府机构,每家机构平均拥有的 IT 基础设施折算成标准机柜约五至二十架,合计约两百五十万至一千万架机柜的迁移潜力,是整个第三方 IDC 市场存量机架规模的二十%至八十%。如果这一迁移在二〇三〇年前完成一半,将产生约一千亿元以上的政务云 IDC 采购规模。
但政务算力市场的竞争格局与商业 IDC 截然不同:国有云厂商(中国电信天翼云、中国移动移动云、中国联通联通云)在政府客户中拥有先天的信任优势和渠道优势,占据了约七十%的政务云份额;华为云和阿里云各约占十%至十五%;第三方专业 IDC 运营商在政务云领域的份额极为有限,主要以机柜托管而非整体运营服务的形式参与。
数据中心投资回报分析:10 年期的经济账
一座大型数据中心(IT 设计容量 50 MW,约三万架标准机柜)的十年期经济账大致如下:
初始建设投资约三十亿至五十亿元(含土建、配电、制冷、综合布线、基础网络,不含 IT 设备本身);年度运营成本约六亿至十亿元(电费占六成、人工和维护占三成、折旧占一成);按当前市场租金水平,满载状态下年度收入约八亿至十五亿元(依据东部/西部、传统 IDC/AIDC 的差异);静态回报期约六至十年,这是数据中心行业普遍接受的投资回收周期。
AIDC(AI 算力中心)的经济模型有所不同:IT 设备(GPU 服务器)本身的价值占建设总投资的六十%至七十%(而传统 IDC 中 IT 设备只占总投资约三十%),意味着 AIDC 的资本密集度远高于传统 IDC;但 AIDC 的单位算力收入也远高于传统 IDC(GPU 小时单价约为传统机柜小时单价的十至五十倍),若使用率维持在七十%以上,AIDC 的静态回收期可缩短至四至六年。这也是为什么二〇二四年至二〇二五年大量资本涌入 AIDC 建设:高于传统 IDC 的收益率,叠加大模型商业化带来的需求确定性,使 AIDC 成为中国基础设施投资中最受资本青睐的细分赛道之一。 数据中心选址的精细化决策:六个关键变量
随着数据中心行业的成熟,选址决策已经从过去的"经验拍板"演进为系统化的量化评估体系。专业的数据中心开发商在选址时,通常需要综合评估以下六个维度:
电力可靠性与成本(权重约三十%):不只是看电价,更要评估输变电容量的可扩展性(现有变电站能否支持未来二到三期扩容)、电力供应双路冗余(是否有两个不同变电站的电力接入)、历史停电频率(区域电网稳定性)、绿电可获得性(购电协议中新能源电力的比例)。西部节点在电力成本和绿电比例上优势明显,但电网稳定性历史记录(部分偏远地区风光电的出力波动性大)需要额外核实。
网络互联条件(权重约二十五%):到最近骨干互联网交换节点的距离(物理距离决定光纤传输时延)、可接入的运营商数量(多家运营商的网络接入保证带宽竞争和冗余)、到主要客户(北京、上海、深圳互联网公司)的网络时延(直接决定时延敏感型业务是否适合在此部署)。这一维度在西部节点是最大的短板——贵安到北京的网络时延约三十五至五十毫秒,内蒙古到北京约十至十五毫秒,而廊坊到北京只有三毫秒。
土地与建设条件(权重约二十%):地质稳定性(断层分布、地震风险、地基承载能力)、地下水位(影响冷水系统设计)、洪涝风险(数据中心对水浸灾害极度敏感)、土地证和建设审批的可落地性(部分地区土地性质变更复杂)、当地建筑材料和劳动力的可获得性(影响建设成本)。
自然冷却潜力(权重约十五%):当地气候条件对自然冷却(利用室外低温空气辅助机房降温)的支持程度,是决定 PUE 优化上限的关键。内蒙古冬季(十月至次年四月)室外气温长期低于十摄氏度,全年约一半时间可利用自然冷却,贡献显著的 PUE 改善;而广东、深圳全年高温高湿,几乎没有利用自然冷却的条件。
政策支持力度(权重约七%):包括税收优惠(企业所得税、增值税减免)、电费补贴(部分地方政府对大型 IDC 提供电费直补)、用地政策(工业用地还是数据中心专用地)、审批效率(从申请到开工的平均周期)。西部节点在这一维度有最强的政策支持,但政策的稳定性(是否会在换届后调整)也是需要评估的风险因素。
人才供给与生活配套(权重约三%):IT 运维人才的本地供给量、周边高校的计算机和电气工程相关专业规模、生活配套(住房、教育、医疗)是否能留住外地工程师。这一维度在早期往往被忽视,但在数据中心投入运营后会成为影响运营质量的重要因素,是部分西部节点"建得起、用不好"的根本原因之一。
第三方 IDC 的技术服务能力进化
数据中心行业正在经历从"设施提供商"向"技术服务商"的定位升级。这一转变的背后,是大型 AI 客户的需求已经超越了简单的"机柜 + 电力 + 带宽",开始需要 IDC 运营商提供包括以下内容的综合服务:
算力即服务(Computing as a Service):客户不采购服务器,直接以"GPU 小时"为单位购买算力,IDC 运营商负责采购、维护、调度所有硬件。这一模式对 IDC 运营商的技术能力(GPU 集群管理、计量计费、弹性扩缩容)提出了远高于传统托管的要求,但也带来了远高于传统托管的单机柜 ARPU(平均每用户收入)。
定制化机房工程:为不同 AI 客户(大模型训练场景、推理场景、科学计算场景)提供定制设计的机房方案,包括定制的配电系统(不同功率密度)、网络架构(InfiniBand vs 以太网)、制冷方案(风冷 vs 冷板液冷 vs 浸没液冷),而非标准化的"通用机柜"。这要求 IDC 运营商具备深厚的数据中心工程设计能力,而不只是一个"物业管理"角色。
数字孪生与实时监控:为客户提供其在 IDC 内所有硬件的实时数字孪生(Digital Twin),可视化机房温度场、功率分布、网络流量,支持远程操作和故障预警。这一服务正在从高端 IDC 的差异化功能,走向主流 AIDC 的基本期望。
安全合规服务:随着各行业数据安全合规要求提升(金融行业的等级保护三级、政府数据的国密要求、医疗数据的本地化存储),IDC 运营商提供完整的合规保障(物理安全等级、网络隔离方案、日志审计)成为拿下政企大单的必要条件。
数据中心运营托管(Managed Operations):部分企业(尤其是制造业和传统行业)在自建了数据中心基础设施后,希望委托专业 IDC 运营商提供全面的运维托管服务(人员、流程、工具),支付固定的年度服务费。这一细分服务在欧美已相当成熟,在中国正在快速成长,对 IDC 运营商来说是额外的高利润收入来源(相比机柜租用,托管服务的毛利率通常高出十至十五个百分点)。
存储设备在 AI 时代的新角色
大模型时代,存储设备在数据中心产业链中的战略价值被重新定义。传统 IT 架构中,存储是计算的配角;在大模型训练中,存储是制约训练效率的关键瓶颈之一。
大模型训练的数据集通常规模在数百 TB 至数 PB(Petabyte)量级,包含预处理后的文本、图像、代码数据。训练过程中,GPU 集群需要以极高的速度(通常要求数据吞吐量达到数百 GB/s)持续向 GPU 喂入训练样本,若存储系统跟不上,GPU 就会出现"饿机"(Stall),训练效率大幅下降。
为满足这一需求,大模型训练集群通常采用"分层存储"架构:极高速的 NVMe SSD 存储(用于热数据)+ 大容量对象存储(用于冷数据归档)+ 高性能并行文件系统(如 Lustre、GPFS)贯通两层。中国的存储设备市场,在 AI 需求的带动下正在经历一次换代——过去以机械硬盘为主的冷存储系统,正在被大容量全闪存阵列(Full Flash Array)替代,全球闪存颗粒(NAND Flash)的供给也因此面临新一轮周期性需求上涨。华为、华三(新华三)、联想存储、忆联是国内企业存储领域的主要玩家,在政府和金融等国央企场景已经形成了显著的本土竞争力,但在互联网头部大厂的高端存储采购中,与纯闪存阵列厂商(Pure Storage、NetApp)仍有一定差距。
机房建设工程:一座 AIDC 的建造全流程
从一片空地到一座可以投入运营的大型 AIDC,通常需要以下工程阶段:
规划设计阶段(三至六个月):确定机房规模(IT 负载规模、机柜数量)、配电架构(10 kV 高压进线、变配电系统设计)、制冷方案(风冷/冷板/浸没)、网络架构(叶脊交换机层级、光纤布线路由)、消防系统(气体灭火系统设计,需满足消防规范)。这一阶段需要数据中心专业设计院或工程咨询公司的参与,设计费通常约为总建设费用的三%至五%。
土建施工阶段(六至十二个月):场地平整、基础施工、主体结构建造、屋面防水、机房地面(防静电)、幕墙工程。AIDC 的楼板结构承重要求(12—16 kN/㎡)高于普通工业厂房,抗震等级通常要求按当地设防烈度提高一个等级,这些特殊要求会显著增加土建成本(约为普通工业厂房的一点五至两倍)。
机电安装阶段(与土建后期并行,六至十二个月):高压变配电系统安装调试、UPS不间断电源系统安装、精密空调及冷水系统安装、液冷管路(如采用液冷方案)预安装、数据中心综合布线(弱电、光纤、铜缆走线架)。这一阶段是质量控制的关键期,电气系统的任何设计错误或施工缺陷,都将在建成后带来潜在的安全和可用性风险。
IT 设备安装与调试阶段(两至三个月):服务器、机架服务器、存储设备、网络交换机上架,网络连通性测试,GPU 集群压力测试(Burn-in Test,持续满负载运行数天检验稳定性),液冷系统泄漏检测,DCIM 监控系统联调。
验收与投产阶段(一至两个月):第三方机构对数据中心设施进行 Tier 认证(Uptime Institute Tier I-IV)或等级保护测评,完成所有竣工验收文件,进行计划性停电演练(验证 UPS 和柴油发电机组的自动切换时间是否满足要求),正式向客户开放服务。
整个流程从开工到交付,大型项目通常需要十八至三十个月,超大型(Hyperscale)项目可能更长。这也解释了为什么数据中心的供给弹性相对较差——当市场需求突然爆发(如 AI 算力需求的突然上涌),不可能在六个月内通过新建产能来满足,必然导致供给滞后于需求,推动价格上涨。这种供给滞后性,也是 IDC 运营商存量资产估值的重要保障来源。
第六章 重点企业:从财报到竞争壁垒的逐家解析
一、IDC 运营商阵营
润泽科技(300442):净利润行业第一的超级 IDC
润泽科技是过去两年中国 IDC 行业最亮眼的增长故事。其二〇二五年全年营收五十六点七四亿元,同比增长约三十%;归母净利润五十点五〇亿元,同比大幅增长一百八十二%。AIDC 业务营收二十五点一亿元,占总营收的四十四点二四%,成为第一大单一业务来源。利润率之所以领跑同行,关键在于其自持土地和自建电力设施降低了租地和电力采购成本,同时与字节跳动、腾讯等超大型客户签署了长期租约,锁定了高稳定的收入基本盘。
润泽的核心资产是位于河北廊坊的超大型数据中心园区,总规划机柜规模达数十万架,廊坊紧邻北京、电力充沛,是北京互联网公司外迁数据中心首选目的地。二〇二五年,润泽加速向智算中心转型,通过搭载华为昇腾集群的 AIDC 业务实现了毛利率的显著提升——AIDC 毛利率远高于传统 IDC 的二十五%至三十%。
值得注意的是,润泽科技在二〇二五年年报发布前曾披露约三十亿元的历史会计差错,引发市场对财务可靠性的质疑,但其在最终年报中经审计师确认,核心财务数据仍呈正面趋势。
万国数据(NYSE GDS / HK 9698):中国最大中立 IDC 运营商
万国数据(GDS Holdings)是中国第三方 IDC 市场的龙头,在十余个城市运营超过一百个数据中心,总机柜容量约二十万个(以 kW 计量约两百万 kW),是中国大型互联网和金融客户的首选第三方运营商之一。中国信通院的二〇二五年《算力中心服务商分析报告》将其列为"领航者"的首位。
万国数据的财务模型以长期合同为主(通常五至十年),客户集中度高(腾讯、阿里、字节是前三大租户,合计营收占比超过六十%),这既带来稳定的现金流,也带来客户集中风险。近年来,万国数据在东南亚(新加坡、马来西亚)和中东加速出海布局,将中国模式(大规模园区 + 稳定长租客户)复制到新兴市场,在国际化进程中处于中国 IDC 运营商前列。
世纪互联(NASDAQ VNET):多元化运营,迈向智算转型
世纪互联(VNET Group)是中国历史最悠久的第三方 IDC 运营商之一,在中国二十余个城市有布局。其二〇二四年全年净营收八十二点六亿元,同比增长约十一点四%,二〇二五年引导区间为九十一至九十三亿元,同比增长约十至十三%。与润泽的重资产自持模式不同,世纪互联采用更轻的"资产轻量化"策略,通过 REIT 出售存量资产、释放资金用于新一代 AI 数据中心建设。世纪互联在超大型 AI 算力需求面前的核心挑战,是如何从传统 IDC 运营商转型为能提供高功率密度 GPU 机柜和配套液冷服务的 AIDC 运营商,这一转型所需的资本支出规模和技术门槛,均明显高于传统 IDC 扩容。
光环新网(300383):资产减值拖累,面临再出发
光环新网曾是北京地区互联网数据托管的标志性企业,其合作方苹果中国的数据中心业务一度是其营收支柱。二〇二五年全年营收七十一点七八亿元,同比下降约一点四%;归母净利润亏损七点五九亿元,主因计提商誉减值准备八点六四亿元——这与其此前收购的数据中心资产价值重估有关。光环新网的问题折射出一个结构性矛盾:传统 IDC(5—10 kW 普通机柜)的盈利空间在 AI 时代被快速压缩,但向高密度 AIDC 升级需要巨额资本再投入,轻资产运营商在这一转型窗口面临较大的竞争压力。
宝信软件(600845):工业软件 + IDC 双轮,短期业绩承压
宝信软件是宝武钢铁集团旗下的工业软件和 IDC 综合服务商,其 IDC 业务主要服务于宝武钢铁的内部数字化需求,并向外部企业客户开放。二〇二五年全年营收一百零九点七二亿元,同比下降约二十%;归母净利润十三点零五亿元,同比减少约四十二%。营收下滑的主因是工业软件和定制化工程项目的交付周期延长及部分项目暂缓,而非 IDC 业务本身衰退。宝信 IDC 的核心优势在于与宝武集团的深度绑定,自有电力和土地资源较为充裕,但在市场化竞争中,相对于专业第三方 IDC 的运营效率和商业灵活性仍有差距。
奥飞数据(300738):东南亚出海先锋
奥飞数据在二〇二五年全年营收二十五点二一亿元,同比增长约十六点五%;归母净利润一点三二亿元,同比增长约六点七%。IDC 服务收入约十九点六亿元,同比大幅增长四十一点八%,是奥飞数据最核心的增长引擎。奥飞数据的独特之处在于东南亚出海布局——其在马来西亚、印度尼西亚、泰国均有数据中心项目落地,是中国中型 IDC 运营商中国际化布局最广泛的之一。国内业务以广东为大本营,依托大湾区的互联网和金融科技客户资源。
二、AI 芯片阵营
寒武纪(688256):从亏损到盈利的国产 AI 芯片破局者
寒武纪是国内最早专注于 AI 芯片设计的上市公司。二〇二五年,寒武纪实现营收约六十四点九七亿元,同比增长约四百五十三%;净利润二十点五九亿元,首次实现年度盈利,扭转了多年亏损的局面。这一业绩爆发的背后,是国产算力替代需求的集中爆发:中科院系统、国有云服务商(移动云、联通云、电信云)大规模采购寒武纪 MLU590 系列加速卡,用于构建不依赖 NVIDIA 的国产算力底座。
寒武纪的竞争优势在于与中科院深度绑定的生态和在政府、军工、国央企客户的先发优势;劣势在于生产制造完全依赖代工,量产良品率和供应链稳定性仍是挑战,同时在互联网商业大客户中的份额相对较低。
海光信息(688041):百亿营收,商业化最成熟的国产算力卡
海光信息是目前商业化程度最高的国产 AI 芯片和高性能处理器厂商。二〇二五年营收约一百四十三点七六亿元,同比增速显著,首次突破百亿大关;净利润约二十五点四五亿元。其产品线涵盖海光 CPU(服务器通用处理器)和 DCU(数据中心通用加速卡),DCU 与 AMD ROCm 生态高度兼容,软件迁移成本较低,受到以商业效率为优先的互联网和金融客户青睐。相比寒武纪,海光的客户结构更为均衡,包含部分主流互联网大厂,这也使其营收规模和盈利能力均领先于同类国产芯片公司。
华为昇腾 Ascend:国产 AI 芯片生态的绝对核心
华为昇腾虽未单独上市,但其在中国 AI 芯片市场的地位无可替代。二〇二五年,华为昇腾 910B/910C 出货量约八十一点二万张,在国产 AI 加速卡中占约四十九%的份额,即将近一半的国产算力卡出货来自华为。
华为昇腾 910C 的实测算力约为 NVIDIA H100 的六十%,但在与华为 MindSpore 框架、鲲鹏 CPU 的协同优化下,在特定模型和场景(如图像分类、推荐模型)中已能与 H100 比肩。华为构建了从芯片(昇腾)到操作系统(华为欧拉)到 AI 框架(MindSpore)到云服务(华为云)的完整自主生态,在中国政府和国央企客户中几乎构成了"算力体系标准答案"。其主要挑战是 TSMC 制造工艺的限制(因美国出口管制,最先进制程封装被限制)导致芯片功耗和面积效率低于使用台积电 3nm 工艺的 NVIDIA Blackwell,但华为已在积累技术纵深,昇腾 960 计划于二〇二七年四季度问世。
摩尔线程(未上市,IPO 推进中)
摩尔线程定位于图形和通用计算融合,其 MTT S4000 系列在端侧 GPU 和视频转码场景表现出色,并在二〇二五年发布了面向训练推理的高端卡 KUAE。公司已进入 IPO 辅导阶段,若能顺利上市,将成为国产 GPU 赛道又一重要公开市场选手。
沐曦集成 MetaX:以兼容性为核心的追赶者
沐曦集成的差异化策略是芯片架构与 CUDA 生态高度兼容,降低从 NVIDIA 平台迁移的软件适配成本,二〇二五年营收约十五点零六亿元,定位于追赶国产化空间最大的中端训练和推理市场。
三、AI 服务器阵营
浪潮信息(000977):全球 AI 服务器出货量第一
浪潮信息是中国乃至全球最大的 AI 服务器制造商,其 JovaMES 系列 AI 服务器搭载 NVIDIA(出口受限后转向国产芯片)和国产 GPU/NPU,是各大云厂商 GPU 集群扩容的核心供应商。二〇二四年营收一千一百四十七点六七亿元(同比增长七十四%),二〇二五年前三季度主营收入一千二百零六点六九亿元,同比增长四十四点八五%;前三季度归母净利润十四点八二亿元,同比增长约十五%。浪潮的制造优势显著,但其商业模式决定了净利率极低(约 2%),属于高营收、薄利润的装配制造模式;随着 NVIDIA 芯片进口受限,浪潮在适配国产 GPU(昇腾、海光、寒武纪)AI 服务器上的投入大幅增加,供应链复杂度上升。
中科曙光(603019):AI 服务器 + 智算中心运营的双轮
中科曙光是既做 AI 服务器制造、又参与智算中心运营的少数玩家之一,旗下"曙光数创"(872808)专注液冷数据中心基础设施,是曙光系在智算时代的新战略支点。曙光数创在二〇二五年实现了液冷业务爆发性增长,成为国产液冷解决方案的领军企业,主要客户覆盖字节跳动、腾讯、百度智算中心。中科曙光整体二〇二五年前三季度营收八十八点二亿元,同比增长约九点七%,净利润九点六六亿元,同比增长约二十五点六%,利润率好于浪潮,体现了软硬件一体化方案溢价。
四、液冷阵营
曙光数创(872808):国产液冷龙头
曙光数创聚焦数据中心液冷基础设施,其核心产品是整机柜浸没液冷服务器和冷板液冷方案,已交付多个万卡 GPU 集群整机液冷项目,是业界交付规模最大的浸没液冷方案商之一。主要客户包括字节跳动(抖音/TikTok 智算中心)、腾讯、电信运营商,产品服务出货至中国各大枢纽节点。在北交所上市,市值相较于沪深同类企业更具弹性。
高澜股份(300499):新能源 + 数据中心双赛道液冷
高澜股份的业务横跨新能源(储能液冷)和数据中心液冷,提供 12U 浸没液冷模块,支持单机柜最高 200 kW 散热能力,主要客户包括字节跳动和腾讯,其二〇二四年年报显示 IDC 液冷业务快速增长,订单积压延续至二〇二六年。新能源和 IDC 两个增长赛道的叠加,使高澜成为液冷板块估值弹性最大的标的之一。
申菱环境(301018)和同飞股份(300990):作为二线液冷供应商,主要专注于精密空调升级改造和冷板液冷 CDU(冷量分配单元)市场,在大型 IDC 改造项目中有一定份额,但规模相对有限。
五、国际基准:Equinix、Digital Realty、NVIDIA、CoreWeave
Equinix 以九十亿美元年收入、超过二百六十个全球数据中心的规模,树立了中立 IDC 运营商的商业模式标杆:高密度互联(Internet Exchange)创造网络效应,差异化于单纯机柜出租;全球统一运营标准和管理体系,降低客户跨地区扩张的摩擦成本;稳定的 REIT 结构,吸引长期机构资本支持持续扩张。这一模式在中国本土尚无完全对标的企业,万国数据在向此方向靠拢,但在互联交换这一关键差异化服务上仍有差距。
NVIDIA 在 AI 算力市场的地位,与中国国产 GPU 的追赶故事,构成了这个行业未来五年最主要的技术竞争主线。Blackwell 架构的 GB200 NVL72 系统(将七十二颗 B200 GPU 通过 NVLink 连接成超节点)已将单机柜算力密度推向两百千瓦量级,彻底改变了机房基础设施的设计逻辑——任何基于旧功率密度设计的数据中心,都需要大规模改造才能容纳 Blackwell 集群。CoreWeave 的崛起则证明,在超大规模采购 NVIDIA GPU 并向 AI 企业出租算力这一垂直细分赛道,可以快速建立可媲美大型云厂商的商业规模,其五十五亿美元的合同积压足以支撑三至五年的高速增长。 润泽科技:解析 182% 净利润增长的结构
润泽科技的二〇二五年业绩报告,对于理解中国 AIDC 运营商的盈利逻辑具有教科书级的参考价值。一百八十二%的净利润增幅,并非简单的营收增长所致,而是几个有利因素的共振:
第一,AIDC 业务爆发带来毛利率显著提升。润泽 AIDC 业务(基于华为昇腾集群的智算服务)毛利率明显高于传统 IDC(传统 IDC 毛利率约三十%,AIDC 毛利率据分析师估算超过四十%至五十%)。随着 AIDC 收入占比从二〇二四年的不到三十%提升至二〇二五年的四十四%,整体毛利率结构性改善。
第二,财务费用管控与运营效率提升。润泽科技主要资产是廊坊的自持园区,土地和部分电力基础设施属于长期固定成本,已基本摊销完毕,在增量营收上基本不增加固定成本,带来了显著的"规模杠杆"效应(operating leverage)。
第三,大客户长约锁定带来现金流改善。润泽与字节跳动、腾讯等头部客户签署的五至十年长期合同,预付款或高频付款的合同结构,显著改善了经营现金流,减少了融资需求。
值得投资者注意的是,润泽在二〇二五年年报发布前曾披露约三十亿元的历史会计差错,这一差错主要涉及之前年度 IDC 项目成本确认的时点差异,经会计师审计后进行了追溯调整。这提醒投资者,对成长性数据中心企业,应对资产确认、收入确认方法进行仔细审阅,而非仅凭营收和净利润的绝对增幅做判断。
万国数据的出海战略:为什么东南亚是下一个战场
万国数据选择东南亚作为国际化优先目的地,背后有扎实的商业逻辑。东南亚六国(印度尼西亚、泰国、马来西亚、菲律宾、越南、新加坡)合计人口约六点七亿,互联网普及率已超过七十%,但数据中心基础设施密度仍远低于中国和美国。随着 TikTok(字节跳动)、Shopee(SEA 集团)、Grab 等互联网平台在东南亚的用户规模持续扩张,本地化数据存储和计算需求快速增长,但本地企业(如泰国 True 集团、印度尼西亚 Telkom)的数据中心建设能力明显落后于需求。
万国数据在新加坡、马来西亚的运营,主要服务于要求数据不出当地的政府合规客户和跨国企业。新加坡作为东南亚最成熟的互联网交换节点,尽管本身面积有限且政府对新建数据中心有总量管控,但其互联生态价值使之成为进入东南亚市场不可绕开的"枢纽"。万国数据的海外业务扩张,代表了中国 IDC 运营商将成熟商业模式(大规模长合同园区运营)复制到高增长新兴市场的典型路径,其中国内沉淀的运营标准化能力和供应链资源,是其在海外市场实现低于本地竞争对手成本的核心优势。
寒武纪:从"PPT 芯片"质疑到净利润 20 亿的逆袭
寒武纪的二〇二五年财报,终结了外界多年来对其"有收入没利润"商业模式可行性的质疑。净利润二十点五九亿元的背后,是一次结构性的客户结构转变:从依赖少数国有背景大客户(如中科院计算所)转向在国有云服务商(移动云、联通云、天翼云)中形成规模化采购,三大运营商的"国资算力体系"建设为寒武纪提供了稳定且体量可观的订单基本盘。
营收四百五十三%的增速,在芯片行业中极为罕见,其主要成因是两年累积订单的集中交付——二〇二三年、二〇二四年签署的政府和国有云大单,在二〇二五年批量出货确认收入,叠加下半年新签订单的增量贡献。这一增速在二〇二六年、二〇二七年是否可以持续,取决于:政府算力基础设施投资节奏是否维持、寒武纪是否能进一步突破互联网头部商业客户、新款 MLU 系列的性能提升是否能满足更高性能推理场景的需求。
寒武纪面临的长期技术挑战,是软件生态完善度。相比华为昇腾有整个华为云和鸿蒙生态背书、海光 DCU 有与 ROCm 的高度兼容性,寒武纪的 MagicMind/Cambricon-BANG 生态的第三方框架支持仍不如前两者完善,大量热门开源模型(LLaMA、Mistral、Stable Diffusion 等)的寒武纪适配版本,仍需要相当的工程投入。这一"最后一公里"的软件生态差距,决定了寒武纪暂时难以打入对开发者友好性要求最高的互联网大厂。
海光信息的技术路线:兼容生态的战略选择
海光信息在国产 GPU 替代浪潮中走了一条与寒武纪截然不同的路——高度兼容现有的 x86/ROCm 软件生态。海光 CPU(代号"海光"系列)基于 AMD Zen 架构的授权,实现了与 x86 指令集的高度兼容,软件无需重新适配即可运行;海光 DCU(深度计算单元)则与 AMD ROCm 开源框架深度兼容,HIP(Heterogeneous-computing Interface for Portability)编程接口与 CUDA 高度相似,从 CUDA 迁移的成本远低于迁移至昇腾或寒武纪。
这一路线的战略优势是客户采购决策周期短——IT 采购负责人不需要冒大规模软件重写的风险,只需替换硬件,即可在相对短的时间内完成"去 NVIDIA 化"。这使海光在金融、政府、运营商这类对业务连续性高度敏感的行业客户中,获得了超出其技术绝对水平的市场份额。
二〇二五年突破百亿的营收,是海光成立以来的里程碑,也是中国国产高性能芯片中第一个在商业规模上真正可以与 NVIDIA 相提并论的产品线——尽管在性能绝对水平上仍有差距,但在市场需求匹配度和生态兼容性维度上,海光已经形成了独特的竞争优势。
浪潮信息的苦乐:全球第一的装配生意
浪潮信息营收突破千亿,看似荣耀,实则是一盘苦涩的生意。其净利润率约二%,在营收千亿级的制造业公司中属于极低水平,类似于鸿海精密(富士康)的代工模式——赚的是组装和供应链整合的钱,而非技术溢价。
浪潮的模式是:采购 NVIDIA/AMD GPU(受管制后切换国产)、英特尔/AMD CPU、三星/SK 海力士内存,按客户规格组装成标准化或定制化 AI 服务器,以极薄的加工利润和规模优势赢得全球超大型云厂商的采购份额。这一模式的问题在于:一旦上游 GPU 供应受限(如美国出口管制),浪潮的加工量急剧萎缩,且因没有核心元器件定价权,在谈判中处于弱势;一旦客户(AWS、Google)选择更换供应商或自研服务器(ODM direct model),浪潮的订单可能骤然下降,且很难通过提价来补偿。
尽管如此,浪潮在 AI 服务器这个特殊窗口期仍然创造了价值:在 NVIDIA 向中国供货期间(H100/H800 出口管制之前),浪潮凭借其与 NVIDIA 的深度合作,获得了大量中国头部互联网公司的 GPU 服务器订单,形成了显著的规模效应和供应链协作能力。在切换至国产 GPU 适配的过程中,浪潮的服务器系统集成能力(如何将多张国产 GPU 高效连接、散热、配电)也成为了不可忽视的技术壁垒。
科华数据、科士达:电源设备的静默赢家
在 IDC 行业的聚光灯之外,有一类企业在静默中受益于数据中心扩张的每一个波次——数据中心电源设备制造商。科华数据(002335)和科士达(002518)是中国最主要的 UPS、模块化 UPS 和数据中心电源解决方案制造商。
每一座新建数据中心,无论是传统 IDC 还是 AIDC,都必须配备 UPS 和高压直流(HVDC)配电系统,这部分采购无法省略、无法推迟、无法国外替代(因为中国数据中心通常使用符合中国电力标准的设备)。随着数据中心扩张加速,科华、科士达的订单也随之持续增加,且相比服务器、GPU 等核心 IT 设备,UPS 电源的技术门槛更低、竞争格局更稳定(国内前三名合计份额超过五十%)、政策敏感度更低,是数据中心供应链中确定性最高的受益环节之一。
科华数据在二〇二五年收入预计超过六十亿元,科士达预计超过三十亿元,两者均受益于 IDC 液冷升级对高功率密度配电系统的新需求(传统 10 kW 机柜配 16A 电源,而 100 kW 机柜需要配 63A 或更高规格配电,整个配电系统都需要升级换代)。
第七章 中游产业带:从贵州数谷到东南亚出海的地理版图
如果说 AI 芯片和 IDC 运营商是算力行业的面子,那么一座座分布在中国各地乃至海外的数据中心园区,才是这个行业真正的里子。理解这些产业带的分布逻辑,就是理解中国算力基础设施的空间经济学——哪里有低电价、哪里有绿电、哪里有政策红线,哪里就会长出数据中心的集群。
贵州贵安数谷:中国第一个超大型西部算力枢纽
贵安新区是"东数西算"工程中最先打响名声的西部节点。这里聚集了中国大陆最大的苹果数据中心(苹果 iCloud 中国数据,由云上贵州运营)、腾讯七星数据中心、华为云数据中心、中国电信、中国移动的大型算力中心群,以及中国移动·贵安数据中心(全球最大单体数据中心之一)。
贵安的核心优势是:年均气温约十四摄氏度(大幅降低制冷能耗)、乌江流域水电充沛(绿电占比超过七十%)、地质稳定(地震烈度低)、政府政策力度大(电价优惠、土地成本低)。全国一体化算力网络国家(贵州)主枢纽中心项目累计建成一百一十六 P 高性能智算中心与五十 PB 非结构化数据存储平台,已建成上电机柜五百九十五架,整体上线率达约三十六%(仍有快速提升空间)。贵州全省算力规模已超过五万 P,在全国各省算力排名中稳居前五。
对于 AI 企业而言,贵安最大的吸引力是"训练算力批发价格最低"——一些贵州算力中心的 GPU 小时计费价格仅为北京、上海市场价的一半至三分之二,对需要大规模跑训练任务的大模型公司有强烈吸引力。
内蒙古乌兰察布:北方算力的绿色制高点
内蒙古的和林格尔新区(呼和浩特市)是另一个"东数西算"明星节点,其核心优势是风电和光伏资源极为丰富。和林格尔新区已有三十九个数据中心项目落地,在用总算力规模达五点零六万 P,其中智算规模四点七七万 P,占总算力的九十四%,绿色算力指数全国第一——这意味着和林格尔几乎是一个"纯绿色智算"节点,对跨国企业的 ESG 绿色算力需求具有独特竞争力。
乌兰察布集群则侧重吸引北京、天津的大数据中心外迁,腾讯、阿里巴巴均在此设有大规模数据中心,总建设规模超过百万架。内蒙古的弱点是冬季室外温度极低(有助于进一步降低制冷能耗,但也带来设备防寒挑战)和人才供给相对薄弱。
甘肃庆阳:西北算力的新枢纽
庆阳数据中心集群是西北区域"东数西算"的旗舰项目。截至二〇二四年底,庆阳集群已建成标准机架三点一万架,算力规模突破五万 P,吸引了三百余家数字经济企业落户,包括国内半数以上的人工智能头部企业——这个数字令人侧目,说明甘肃在吸引 AI 企业落地算力方面已经形成显著的集聚效应。庆阳的电力结构以陇东煤炭发电为主,兼有光伏,绿电比例相对低于内蒙古和贵州,这是其在绿色算力评级上的短板。
宁夏中卫:数据中心与光伏的共生实验
宁夏中卫被规划为"东数西算"最具特色的绿色算力示范区之一。截至二〇二四年底,宁夏全区标准机架超过十三万架,算力规模达三点一万 PFLOPS,综合算力指数首次进入全国前十,在用智算中心数量居全国第五。中卫最独特的模式是"光伏算力一体化"——在中卫中关村数据港等园区,太阳能光伏发电板与数据中心机房建在同一地块,实现算力消纳和绿电自发自用,PUE 长期保持在 1.2 以下。
中卫还吸引了微软(透过 21Vianet 世纪互联)、美团、中国银行等客户,在政务云和金融云领域有一定市场份额。
北京—河北廊坊:东部核心算力集群
尽管"东数西算"引导算力西移,东部核心城市的数据中心需求并未减少,反而因时延敏感型业务(在线金融交易、实时推理 API、游戏服务)的不可外迁性,价格持续上涨。北京大兴、通州、亦庄以及廊坊的燕郊、固安、廊坊市区,形成了连续分布的北部算力集群,润泽科技的超大型园区是其中最重要的单体节点。廊坊距北京市中心约五十公里,到北京金融街的网络时延约 3 ms,是许多金融客户可以接受的极限外迁半径。
上海—江苏昆山:长三角算力中枢
上海及周边的长三角算力集群是中国经济密度最高、但也是资源最受限的区域。上海市区新建数据中心审批极为严格,外环线内基本暂停新建,大量需求向嘉善(浙江)、昆山(江苏)、青浦(上海郊区)外溢。长三角集群的独特竞争力在于其产业链密度——IT 分销商、系统集成商、半导体供应链大量聚集,数据中心所需的所有设备几乎都能在方圆三百公里内采购完毕。万国数据、世纪互联、腾讯云在长三角均有重大投资布局。
广东深圳:粤港澳大湾区算力核心
深圳数据中心市场的特点是:需求旺盛(腾讯、华为、平安、比亚迪等都在深圳)、供给严重受限(土地稀缺,电力容量批复难)、价格在国内第三方 IDC 中最高。南山区、宝安区的数据中心机柜月租单价普遍在每千瓦三千元以上,远高于廊坊的一千五百至两千元。奥飞数据在大湾区有核心布局,是深圳本地最重要的中型第三方 IDC 运营商之一。大湾区的跨境算力需求(联通香港和内地)也是一个特殊亮点,香港作为国际互联网交换节点,与深圳联动形成了内地国际化业务的优选出口。
成渝双城:西南算力的新高地
成都和重庆作为国家"东数西算"成渝算力枢纽节点,依托四川丰富的水电资源(全国水电装机第一大省)和天然冷凉气候(成都年均气温约十六摄氏度),正在成为西南地区最重要的算力集聚地。成都高新区、天府新区的数据中心集群已聚集腾讯、阿里、华为在内的多家超大型客户,重庆永川"中国云谷"也在快速扩张。成渝的长期优势是四川水电的清洁度(绿电占比高),与贵州水电共同构成西南绿色算力走廊。
海外拓展:印度、东南亚的出海蓝图
中国 IDC 运营商的出海是近两年最受关注的战略布局之一。万国数据、奥飞数据、润泽科技均在东南亚有不同程度的布局。
东南亚是出海的优先目的地:新加坡是区域互联网交换枢纽,但土地和电力极度稀缺,新加坡政府对新建数据中心有总量管控;马来西亚(柔佛州、吉隆坡)以相对低廉的电价和宽松的审批吸引了大量外资,字节跳动、腾讯、阿里已在马来西亚建立了大型数据中心,奥飞数据在此也有布局;印度尼西亚(雅加达、巴淡岛)拥有四点二亿人口的巨大数字化潜力,本地数据中心需求快速增长。
印度正在成为下一个超大型增量市场,人口规模、数字经济基础设施建设密度和年轻消费者的互联网渗透率,吸引了 AWS、微软、谷歌、Meta 竞相在印度新建数据中心。中国 IDC 运营商在地缘政治复杂的背景下,在印度直接投资仍面临较大障碍,但通过向印度本地运营商提供设备和方案,仍有间接参与机会。
天下工厂产业研究院在梳理这张全球算力地理版图时,注意到一个共同规律:无论是贵安的水电绿算,还是内蒙古的风光绿算,抑或是马来西亚的低电价洼地,驱动数据中心集群形成的核心要素永远是三个——足够便宜且稳定的电力、足够友好的政策(地块审批、电力接入速度、税收优惠),以及到核心流量中心的网络时延在可接受范围内。三者缺一,算力枢纽就只是一个故事,而非一个真实运转的生意。那些同时满足三个条件的节点,正在全世界持续涌现,这也是为什么数据中心产业带的版图,正在以前所未有的速度向全球各个角落延伸。 东南亚数据中心投资热潮的深层逻辑
二〇二四年至二〇二五年,东南亚数据中心市场迎来了历史性的投资热潮。谷歌宣布在马来西亚投资二十亿美元建设数据中心,微软宣布在印度尼西亚投资十七亿美元,AWS 计划五年内向东南亚投入超过五十亿美元。中国企业同样不甘落后——字节跳动在马来西亚和新加坡大规模扩张,阿里在泰国宣布投资建设区域数据中心枢纽,奥飞数据在马来西亚柔佛州的项目正在加速推进。
这一投资热潮的驱动因素可以从供需两侧分析:
需求侧:东南亚数字经济增速是全球最快的地区之一(二〇二三年电子商务、数字金融、视频娱乐合计 GMV 约二千三百亿美元,增速约十五%至二十%),本土互联网平台(Grab、Shopee、Gojek、Lazada)以及 TikTok 在东南亚市场的用户规模持续扩张,对本地算力的需求快速增长;各国政府的数字政务项目(马来西亚数字强国计划、印度尼西亚数字化转型、泰国数字经济政策)大幅增加政务云需求;东南亚各国的"数据主权"意识提升(要求本国用户数据必须存储在境内),成为本地数据中心不可绕过的合规要求。
供给侧:新加坡——东南亚历史最成熟的数据中心枢纽——从二〇一九年开始对新数据中心实施严格限批,存量资产极度稀缺,机柜月租单价高达每千瓦一千五百至两千新加坡元(约七千至九千人民币),远超其他东南亚城市;周边国家(马来西亚柔佛、印度尼西亚巴淡岛)凭借低电价(马来西亚约每千瓦时 0.4 马币,约合 0.6 元人民币)和宽松审批,快速承接新加坡溢出的数据中心需求,形成"新马一体化"的数据中心生态带。
马来西亚柔佛:中国 IDC 出海的实验田
马来西亚柔佛州是中国 IDC 企业出海的最重要落地案例。柔佛与新加坡仅隔一条柔佛海峡(最窄处约一千米),通过跨海堤道相连,两地之间的网络时延低于两毫秒,实际上是新加坡数据中心的"技术延伸区"。同时,柔佛的工业用电价格约为新加坡的五分之一,土地成本约为新加坡的十分之一,形成了不多见的"临近高价市场 + 自身低成本"的理想区位组合。
奥飞数据在柔佛布局了其东南亚旗舰项目,计划总规模超过一千架 GPU 级机柜,主要服务于不能将数据存储在中国境内但需要访问亚太节点的中国互联网企业(如面向东南亚市场的字节旗下应用),以及本地的金融机构和政务云需求。万国数据在新加坡和马来西亚的既有运营,则主要服务于其国内大客户(腾讯、阿里)在东南亚扩张所需的本地化部署。
印度尼西亚:潜力最大但门槛最高的市场
印度尼西亚拥有约二点七亿人口,是东南亚最大的单一市场,其数字化渗透率的提升空间极为庞大——尽管智能手机普及率超过七十%,但宽带互联网覆盖率和云服务渗透率仍相对较低。二〇二五年,印度尼西亚数据中心总产能约四百兆瓦,预计到二〇三〇年将超过一千五百兆瓦,增量约一千一百兆瓦(约需建设三至四座大型数据中心园区)。
然而,印度尼西亚的投资门槛也是东南亚最高的:政策规定外资数据中心运营需要与印方合资(部分关键信息基础设施类别要求印方控股),数据主权法(Personal Data Protection Law)对数据跨境传输有严格限制,电网可靠性在偏远岛屿地区较差,建筑施工成本因材料进口依赖而偏高。中国企业在印度尼西亚的直接 IDC 投资,更多采取"向本土运营商提供设备和方案支持"的间接模式,而非独立建设运营。
中东市场:沙特、阿联酋的数字主权野心
中东市场在二〇二四年至二〇二五年迅速成为全球数据中心投资最活跃的新兴地区之一。沙特阿拉伯依托"2030 愿景"(Vision 2030)的数字化转型战略,正在大规模投资建设国内 AI 基础设施,雄心壮志是将沙特打造为中东 AI 的"算力中心";阿联酋(尤其是迪拜和阿布扎比)凭借成熟的商业环境、低税率和全球互联网交换地位,持续吸引大型 IDC 投资。
中国企业在中东市场的机会,一方面是通过与当地主权基金(沙特公共投资基金、阿布扎比主权财富基金)合作,以"数字丝绸之路"框架输出中国的数据中心方案和技术;另一方面,中国大量数据中心基础设施产品(智能机房解决方案、液冷设备、高性能 AI 服务器)正在成为中东在建数据中心项目的重要采购来源。中东市场政治风险相对较低(对中国技术接受度较高),但当地环境对数据中心运营有特殊挑战——极端高温(夏季室外气温超过四十五摄氏度)对制冷系统提出极高要求,必须全年依赖机械制冷,自然冷却的可用窗口极短,数据中心制冷在运营成本中占比远高于温带地区。
欧洲数据中心:绿电标杆与 GDPR 壁垒
欧洲数据中心市场在全球范围内以严格的绿色能效标准和最强的数据保护法规(GDPR)著称,是中国 IDC 运营商最难进入、但也最值得学习的市场。
挪威、瑞典、芬兰的数据中心,依托北欧丰富的水电和风电资源,全年接近百分之百使用可再生能源,PUE 可低至 1.1 以下(北极圈附近的数据中心可以利用零下气温的室外空气全年自然冷却),是全球绿色数据中心的最高标杆。微软在瑞典的数据中心、谷歌在芬兰的数据中心,是这一模式的代表。这些案例为中国西部节点(内蒙古、新疆的风光资源)的绿色算力发展提供了值得借鉴的参照。
德国、荷兰、英国是欧洲 IDC 市场规模最大的三个国家,均是 Equinix 和 Digital Realty 的核心布局地,互联网交换节点(DE-CIX 法兰克福、AMS-IX 阿姆斯特丹、LINX 伦敦)是全球互联网流量密度最高的交换节点之一,其互联价值在全球 IDC 竞争中是独一无二的。中国企业进入这三个市场的核心障碍,是 GDPR 合规要求(任何与欧盟数据主体相关的个人数据,不得在未满足 GDPR 充分性认定的情况下传输至中国)、以及欧盟对中国科技企业日益严格的外商直接投资安全审查机制(EU FDI Screening Regulation)。在这一背景下,中国企业进入欧洲 IDC 市场,目前最可行的路径是以欧洲本地注册子公司或合资公司形式运营,并通过数据本地化承诺和独立的欧洲数据主权保障来应对 GDPR 要求——这条路并非不可走,但复杂度和合规成本都远高于东南亚和中东。
中国 IDC 产业带的完整版图:五类集群的地理分布
如果把中国的 IDC 产业带按功能和地理特征分类,可以梳理出五种典型的集群形态:
一线城市存量稀缺型:北京(海淀、朝阳、通州)、上海(浦东、闵行、嘉定)、深圳(南山、宝安)、广州(天河)。特点是历史存量资产集中,审批管控极严,机柜稀缺价值高,主要服务于对时延极度敏感的金融和互联网实时业务。这类集群是市场化程度最高、价格最贵、流动性最好的 IDC 资产类别。
核心城市卫星节点型:廊坊(北京外溢)、昆山/嘉善(上海外溢)、东莞(深圳外溢)、增城(广州外溢)。特点是网络时延可接受(至核心城市五至三十毫秒)、土地和电力宽松、成本低于核心城市三十%至五十%,是承接核心城市数据中心外迁需求的主力区域。润泽的廊坊基地就是这一类型的最典型代表。
西部低成本训练算力型:贵安、乌兰察布、庆阳、中卫。特点是能源成本全国最低、绿电比例高、但网络时延较高(至一线城市三十至五十毫秒),主要承接批处理训练任务和冷数据存储,对时延不敏感的计算需求。这类集群需要强力政策引导和补贴支持才能维持商业可行性。
工业互联网边缘计算型:依托工业重镇(重庆汽车、苏州工业园、佛山机器人)的工厂侧边缘节点集群。这类集群规模小、分散化,与工厂的数字化改造同步建设,主要服务于工业实时控制、机器视觉、工业大数据分析场景。这是目前建设中最为分散、商业化程度最低的集群类型。
出海枢纽型:依托"数字丝绸之路"战略,在东南亚(新加坡-柔佛、雅加达、曼谷)和中东(迪拜、利雅得)正在形成的中国算力出海集群。这类集群以中国 IDC 企业(万国、奥飞)为主体,承接中国互联网公司国际业务的本地化部署需求,以及当地的政务云和金融云需求。规模仍小,但战略意义极大,是中国 IDC 行业全球化布局的先期试验田。
这五类集群各有定位,并不相互竞争——一线城市存量资产的稀缺价值,不会因西部节点的大规模新建而降低;西部节点的低成本优势,也不会因一线城市机柜租金上涨而被侵蚀。理解这五类集群的差异化定位,是理解中国 IDC 行业地理竞争格局的基础框架。
第八章 细分专题:九个赛道的深度拆解
一、通用 IDC:存量升级与存量整合
通用互联网数据中心(General IDC)是数据中心行业的基础盘,指以机柜托管、带宽服务为主营业务,服务于企业 IT 基础设施外包需求的传统数据中心。在 AI 时代,通用 IDC 的竞争逻辑已经发生根本变化:单纯"提供机柜"的模式面临价格压力,增值服务(网络互联、安全托管、混合云接入)成为利润来源。国内通用 IDC 的上架率持续改善,但行业整体盈利水平分化明显——头部企业(润泽、万国、世纪互联)凭借规模优势和超大型客户锁定,毛利率维持在二十五%至三十五%;中小型 IDC 则面临资金成本高企、大客户流失、服务器散热改造压力等多重挑战。
二、智算中心(AIDC):数据中心赛道的增量核心
智算中心是二〇二五年数据中心行业增量最大、溢价最高的细分赛道。与传统 IDC 不同,AIDC 的核心是 GPU/NPU 集群的规模化部署,单机柜功率密度普遍超过 30 kW,部分超密度机柜已达 80—100 kW,液冷是标配,GPU服务器是最大的单一采购项目。从商业模式看,AIDC 有两种主要路径:一是以润泽、曙光为代表的"自建自营"——自建 GPU 集群,以算力时租或长期合同形式出售;二是以万国、世纪互联为代表的"托管服务"——为客户提供高密度机房基础设施,客户自采 GPU 自行部署。两种模式在资本消耗、收益回报和风险分布上差异显著,自营模式资本需求更大,但长期单位 GPU 收益更高。
三、边缘计算:自动驾驶与工业互联网的算力下沉
边缘计算是指在靠近数据产生侧(工厂、道路、基站)部署微型算力节点,满足实时性要求极高(< 10 ms)的场景,主要包括自动驾驶(路侧 RSU 算力节点)、工业机器视觉、CDN 加速、视频监控分析。中国三大运营商(中国电信、中国移动、中国联通)是边缘计算节点的主要建设者,依托遍布全国的通信基站基础设施,向各行业提供边缘 MEC(多接入边缘计算)服务。边缘计算与通用 IDC 和 AIDC 的差异在于:单节点规模小(数到十数台服务器),数量极多(全国节点数以百万计),标准化程度高,运维要求自动化。
四、液冷数据中心:从可选到必选的技术跃迁
液冷数据中心是当前中国 IDC 行业技术门槛最高、增速最快的细分赛道。驱动液冷加速渗透的核心逻辑是物理必然性——当单机柜功率超过 25 kW 时,风冷的散热效率在物理上已无法满足服务器正常运行所需的热管理要求,PUE 也无法满足政策要求,液冷成为唯一可行的技术路径。
市场规模方面,据头豹研究院二〇二五年报告,中国液冷服务器市场在二〇二四年规模约两百三十七亿元,同比增长约六十七%;三大运营商液冷渗透率预计从二〇二四年的约十四%跃升至二〇二五年的约二十六%。冷板液冷和浸没液冷是两条并行的技术路线:冷板液冷改造成本低、与现有机房兼容性好,是短期内的主流方案;浸没液冷散热效率最高,更适合 100 kW+ 的极高密度场景,是长期趋势。液冷服务器的供应链上游,关键材料包括冷却液(氟化液、矿物油、工程流体)和高精度冷板铜铝件,相关供应商已在中国形成初步完整的本土化产业链。
五、国产 GPU:中国算力自主化的关键战役
在美国出口管制切断 NVIDIA H100/H800/B100/B200 供应后,国产 GPU 替代从"可选项"变成"必答题"。目前国产 AI 加速卡市场呈现明显的头部集中特征:华为昇腾(约四十九%份额)领跑,海光 DCU(约十二%)和寒武纪 MLU(约十%)紧随其后,其余玩家(天数智芯、壁仞科技、摩尔线程、沐曦)合计约二十%,国产合计份额已达四十一%。
国产 GPU 当前面临的核心挑战有三:一是工艺制程受限(华为昇腾依托中芯国际 7nm/5nm,功耗效率和面积效率仍落后 TSMC 3nm),导致芯片功耗和算力密度低于 NVIDIA Blackwell;二是软件生态碎片化,各家 GPU 各有独立 SDK(昇腾/CANN、海光/ROCm、寒武纪/MagicMind),与 NVIDIA CUDA 的兼容性参差不齐,大量模型需要重新适配;三是供应链集成能力不足,整机内的 GPU 互联(类似 NVIDIA NVLink 的解决方案)仍需时间完善。但以二〇二五年为节点看,国产 GPU 已经从"凑合可用"演进到了"主流可选",在政府、国有金融、能源等国央企场景中已成为标准配置。
六、大模型训练算力:百模大战的基础设施底座
中国大模型训练算力市场在二〇二三年至二〇二五年经历了爆发式扩张。DeepSeek、通义千问(阿里)、文心一言(百度)、混元(腾讯)、豆包(字节)、智谱 GLM 等头部模型的每一次参数规模升级,都意味着数以千计 GPU 卡·月的训练算力消耗。训练算力的特点是对吞吐量(而非时延)要求极高,单次训练任务可占用数千乃至数万张 GPU,持续数天甚至数周。这推动了 GPU 集群"万卡集群"成为主流建设规模,单集群投资规模通常超过十亿元人民币,对 IDC 运营商的高压配电、高速网络(InfiniBand 或高速以太网)和液冷能力提出了极高要求。
七、推理算力:商业化阶段的主战场
随着大模型进入商业化部署阶段,推理算力(Inference)在二〇二五年已超越训练算力,成为算力市场最大的单一需求增量。推理的特点是对时延敏感、吞吐量需求多样(从每秒十个请求到每秒数万个请求均有市场),适合使用更多数量、更低规格的 GPU 卡(如 A100、华为 910B、海光 K100)而非顶级训练卡。推理算力的主要提供者是各大公有云(阿里云、腾讯云、华为云)和专门面向 AI 企业的 GPU 云服务商,推理 API 的计费方式从"GPU 小时"演进为"千 token 费用",极大地降低了开发者的使用门槛。
八、数据中心绿色化:双碳目标下的强制性转型
双碳目标(二〇三〇年碳达峰、二〇六〇年碳中和)对数据中心行业的约束是直接的——数据中心是单位面积能耗最高的建筑类型之一,其全国用电量在二〇二五年已超过中国全年总发电量的约三%,并持续增长。在政策层面,国家发展改革委的《数据中心绿色低碳发展专项行动计划》要求新建数据中心全面达到 PUE ≤ 1.3,并推动绿电使用占比提升;在技术层面,液冷、余热回收(利用服务器废热供暖)、智能功率管理(动态调整服务器频率)是 PUE 下降的主要技术手段;在商业层面,绿色算力认证(如 LEED、中国绿色数据中心认证)已成为吸引国际大型企业客户的必要条件。数据中心节能供应商群体——包括冷却方案提供商、能效管理软件商、储能配套供应商——正在成为 IDC 产业链中增长最确定的细分赛道之一。
九、中国 IDC 出海:政策、资本与运营的三重挑战
中国 IDC 企业出海面临三层挑战:政策层面,目标国(尤其是东南亚)对数据主权、电力配额、外资比例均有管控;资本层面,海外建设成本高(当地建设材料和劳动力价格通常高于中国)、融资渠道有限;运营层面,本地化人才、供应链本地化(机房建设所需设备在当地采购成本高)是持续挑战。万国数据是中国 IDC 运营商中出海经验最丰富的,其在新加坡、马来西亚的运营已进入成熟期,但海外资产贡献的营收比例仍低于三十%。出海成功的关键在于找到本地合作伙伴,降低政策风险,并通过规模效应摊薄高额的本地运营成本。
第九章 技术演进:从 30 kW 到 100 kW+ 的功率革命
单机柜功率密度:物理极限的突破
二〇一五年,数据中心标准机柜的功率密度约为 5—10 kW;二〇二〇年,随着 GPU 服务器规模部署,功率密度上升至 15—20 kW;二〇二三年,NVIDIA H100 服务器(8 卡,总功率约 10.2 kW)叠加存储和网络设备后,单机柜功率普遍在 20—40 kW;到二〇二五年,NVIDIA GB200 NVL72 超节点(含 36 颗 Grace CPU + 72 颗 B200 GPU)的单机柜等效功率已达 120—200 kW。这一变化彻底颠覆了数据中心基础设施的设计逻辑:原本按 10 kW/机柜设计的机房,既无法承受地板荷载,也无法提供足够的配电和散热,必须进行系统性改造或重建。
冷板液冷:当前主流的散热技术
冷板液冷(Cold Plate Liquid Cooling)的工作原理是在 CPU/GPU 芯片冷头上安装带水道的铜铝冷板,通过循环冷却液(通常是纯水或乙二醇水溶液)将热量从芯片侧传导到外部冷却系统(CDU,冷量分配单元)。其优势是改造成本相对低(通常只需更换散热冷头和增加 CDU,不改变机架和布线架构)、与现有机房设施兼容性好,适用于 20—80 kW 机柜场景。已大规模商业化,中国主要 AI 数据中心(字节跳动、腾讯、百度)的新建 GPU 集群几乎全面采用冷板液冷。国内 CDU 主要供应商有曙光数创、高澜股份、申菱环境;国际品牌有 Vertiv、Cooler Master。
浸没液冷:极高密度场景的终极方案
浸没液冷(Immersion Cooling)将整台服务器(含所有部件)浸泡在高沸点、高绝缘性能的电子冷却液中,通过液体对流和沸腾换热把热量带走,理论 PUE 可接近 1.0,实际运营可稳定在 1.05—1.1。分为单相浸没(液体不沸腾,依靠对流换热)和两相浸没(使用氟化液,液体沸腾后冷凝回收)两种技术路线。两相浸没散热效率更高,但氟化冷却液价格昂贵(每升数百至数千元不等)且具有温室效应,在部分欧洲市场已受到监管压力。
国内曙光数创(872808)是浸没液冷商业化领域的先行者,已成功交付多个万卡 AI 集群的全浸没液冷机房。在全球范围内,微软已在其 Azure 数据中心部分区域部署了两相浸没液冷系统,并将其作为未来超高密度算力机房的标准方案。
Chiplet 封装与高带宽内存(HBM)
传统的 AI 芯片是将所有计算单元集成在单颗硅片(Die)上,但当芯片面积超过光刻机单次曝光极限(约800 mm²)时,良品率急剧下降,成本不可控。Chiplet(小芯片)封装技术将一个逻辑芯片分解为多个小的功能模块(Compute Die、I/O Die、Memory Die),分别制造后通过 2.5D(HBM 堆叠 + 硅中介层)或 3D 封装组合为一体,兼顾面积效率、良品率和工艺灵活性。AMD EPYC、NVIDIA Hopper/Blackwell、英特尔 Ponte Vecchio 均已全面采用 Chiplet 架构。国内的海光 DCU 和寒武纪 MLU590 也在逐步引入 Chiplet 设计理念。
高带宽内存(HBM,High Bandwidth Memory)是 AI 芯片不可或缺的配件——现代大模型推理需要极高的内存带宽(数 TB/s 量级),传统 GDDR 内存的带宽已是瓶颈。HBM3/HBM3E 通过将 DRAM 芯片垂直堆叠后与 GPU 并排放置于同一基板,实现了带宽的数十倍提升。HBM 市场高度寡头化,由 SK 海力士、三星、美光三家垄断,中国在 HBM 制造上几乎空白,这是国产 AI 芯片在系统级算力上与 NVIDIA 差距的另一重要来源。
数据中心园区智能化与余热回收
大型数据中心的运营管理已经从人工值守走向自动化运维(AIOps):AI 算法基于历史故障数据和实时传感器信号预测设备失效,自动生成维护工单;动态功率管理系统根据服务器实际负载,自动调节精密空调出风温度和风扇转速,在保障热管理安全的同时最小化 PUE;电力容量优化算法在服务器上架高峰期自动均衡各回路负载。
数据中心余热回收是一个正在快速商业化的技术方向:服务器工作时产生的热量(通常为 35—50 摄氏度的热水或更高温度的液冷回液),可以通过热泵系统提升温度后用于园区供暖或工业热水供给。荷兰、挪威等国家已有数据中心废热供城市供热的商业案例,中国北方(北京、内蒙古)的数据中心园区也在试点将废热并入区域供热管网的可行性,这一模式若能大规模推广,将显著降低数据中心的碳排放强度。
高密度 GPU 集群的网络互联挑战
万卡 GPU 集群的训练效率不仅取决于 GPU 算力本身,网络互联的吞吐量和时延是同等重要的瓶颈。NVIDIA 的 NVLink/NVSwitch(GPU 间互联,机架内带宽超过 900 GB/s)配合 InfiniBand NDR(机架间互联,400 Gb/s 双向)构成了目前性能最强的 GPU 集群互联架构,但 InfiniBand 设备仍主要依靠进口(Mellanox/NVIDIA 供应,同样受出口管制风险)。国内正在积极研发国产高速互联方案,华为昇腾集群使用 RoCE(RDMA over Converged Ethernet)方案部分替代 InfiniBand,但在超大规模集群(万卡以上)的网络效率上仍与 InfiniBand 有差距。800G网络交换机和光通信设备的国产化,是未来三至五年国产 AI 基础设施自主化补链的重要方向。 通用 IDC 向 AIDC 转型的具体路径分析
通用 IDC 运营商向 AIDC 转型,并非简单地在机房里放入 GPU 服务器,而是需要对机房基础设施进行系统性改造。以一座设计之初按 10 kW/机柜标准建造的传统 IDC 为例,转型为支持 40 kW/机柜的 AIDC,需要经历以下改造工程:
配电系统升级:原有 16A 配电标准的列头柜需要替换为 63A 或更高规格;UPS 系统(原有设计按十千瓦每架)需要全面扩容或更换更高功率的模块化 UPS;高压变电站的变压器容量可能也需要扩充(传统 IDC 变电站容量按 10 kW×机柜数,转型后需扩容四倍)。配电系统改造往往是 AIDC 升级中最耗时(需停机改造)、也最昂贵的单项改造工程。
冷却系统升级:原有风冷机房的精密空调系统,按 10 kW 总热量设计,散热能力远远不足;轻量化改造方案是在机架侧增加冷板液冷 CDU,并通过冷冻水二次循环回路连接到建筑外部的冷却塔;重量级改造是全面更换冷水机组,改造一次回路(从冷水机组到 CDU),整个冷却系统重新设计。这一过程通常需要三至六个月的停机改造期,对在线服务的业务连续性挑战极大。
网络系统升级:传统 IDC 内部网络通常采用十千兆(10GbE)核心交换,而 AI 服务器集群需要每端口四百千兆(400GbE)甚至八百千兆(800GbE)的内部互联。整个交换机、光缆、光模块系统均需更换,这是 IT 设备层面最大的单项投资。
楼板结构评估与加固:如前所述,高密度 GPU 服务器单机柜重量可达一千至两千千克,远超传统 IDC(单柜约五百至六百千克)的楼板设计荷载。若原有楼板承重不足,需要进行结构加固(在楼板下方增加支撑梁)或限制 GPU 机柜密度,这一评估是每座转型 IDC 不可绕过的技术关卡。
这一系列改造的综合成本,对于一座五千架机柜规模的传统 IDC,通常在二亿至五亿元之间,改造周期十二至二十四个月,改造期间的收入损失是另一项隐性成本。这也解释了为什么大量老旧 IDC 宁可选择被并购整合(以资产换现金,由并购方承担改造),也不愿意独立承担高额改造风险。
边缘计算的商业化现实与挑战
边缘计算是数据中心产业链中最碎片化、也最难规模化盈利的细分赛道。其核心技术逻辑无懈可击——在数据产生侧进行实时计算,避免将全部数据回传到中心数据中心(节省带宽),实现毫秒级时延(满足自动驾驶、工业控制等场景)。然而,从技术可行到商业规模化,边缘计算面临几个结构性障碍:
规模经济难以实现:每个边缘节点规模小(十至数十台服务器),单节点的设备成本、安装成本、运维成本均较高,但收入规模极小;只有节点数量达到数万甚至数十万个,才能通过规模摊薄单节点成本,而达到这一规模需要巨额前期投入。中国三大运营商凭借遍布全国的网络节点基础设施,是边缘计算商业化规模最快的玩家,但商业模式仍以"试点"为主,成熟的规模化收费模式尚未建立。
客户付费意愿不明确:工业互联网、自动驾驶等边缘计算的主要应用场景,目前仍处于基础设施建设阶段,大多数行业客户接受"算力即服务"的意识还未成熟——工厂、物流中心、道路交通管理部门,习惯于一次性采购 IT 设备(服务器、控制器),而非按月支付边缘算力服务费。改变这种采购习惯,需要边缘计算服务商做大量的客户教育工作,这将边缘计算大规模商业化的时间表推迟到二〇二七年以后。
标准化缺失带来集成成本高:不同行业(汽车工厂、智慧港口、医院、电力变电站)对边缘节点的需求差异极大,无法使用同一套标准化方案,大量定制化集成工作推高了每个节点的建设成本,也增加了运维的复杂度。边缘计算的技术标准化(如开放性网络边缘计算,OpenRAN,以及 MEC 的标准接口),是整个行业生态成熟的必要前提。
液冷产品的供应链纵深:从氟化液到铜铝冷板
液冷数据中心的繁荣,正在催生一条新的专用供应链,其纵深远比表面看起来的复杂。
在材料层面,浸没液冷所需的电子冷却液(氟化液、矿物油、工程流体)是关键原材料。氟化液(以 3M Novec 系列为代表,国内有华夏氟辉等)具有最高的散热效率,但每升价格在数百至数千元,且具有一定温室效应(全球变暖潜能,GWP);矿物油价格最低,但粘度高、热导率相对低;工程流体(合成硅油、特种酯)性能居中,是当前两相浸没液冷的主流选择。国内液冷液的本土替代尚处于起步阶段,大量产品仍依赖进口,降低液冷液进口依赖是这一供应链需要解决的中期课题。
在冷板制造层面,液冷冷板需要具备极高导热率的铜铝材料,加工出精密的微通道结构(通道宽度约 0.5—2 毫米),用于最大化冷却液与金属表面的接触面积,实现高效换热。这对材料纯度和精密加工能力有较高要求,国内精密铜铝加工厂商(如华北铝业、云铝股份的精加工子公司)已经开始切入这一细分市场,但高端冷板的批量供货能力与国际竞争对手(如韩国 Heesung Metal)仍有一定差距。
在系统集成层面,CDU(冷量分配单元)是液冷系统的核心分发设备,负责将来自建筑外部冷却塔的冷水(一次回路)与机架内部冷却液(二次回路)进行换热。CDU 需要精确控制二次回路的流量和温度,以适应 GPU 负载变化带来的热量波动,对控制系统的响应速度和可靠性要求很高。国内曙光数创在 CDU 自研上已积累多年,是少数同时掌握 CDU 设计制造和液冷系统集成能力的企业;国际品牌 Vertiv、Emerson 在高端 CDU 市场仍有竞争力,但价格显著高于国内厂商。
国产 GPU 的生态建设:软件定义算力体系的构建
国产 GPU 替代 NVIDIA 的最大障碍不是算力本身,而是软件生态。在详细分析国产 GPU 生态建设的现状之前,有必要先理解 CUDA 生态的护城河为何如此之深。
CUDA(Compute Unified Device Architecture)自二〇〇六年推出以来,已经成为 AI 和科学计算领域的"通用操作系统"。全球超过四百万名开发者、数以万计的 cuDNN(深度学习 CUDA 算子库)和 cuBLAS(线性代数 CUDA 库)经优化例程、PyTorch/TensorFlow/JAX 等主流深度学习框架的核心 CUDA 绑定,以及数以百万计的已用 CUDA 优化的开源 AI 模型代码——这些积累,形成了一道几乎无法绕过的护城河。切换到非 CUDA 平台的开发者,不只需要重写代码,还需要接受以下代价:大量开源社区工具不可直接使用、算子性能未经针对新平台的优化(需要重新调优,通常耗费数周至数月时间)、新出现的 AI 研究成果(大多数以 PyTorch/CUDA 代码公开)需要额外的适配工作。
国内各家 GPU 厂商,正在从不同角度尝试降低这一迁移门槛:
华为昇腾的策略是全栈自研——从芯片(昇腾 910B/910C)到训练框架(MindSpore)到算子库(CANN),构建一套完全独立于 CUDA 的软件体系,同时通过提供大量针对国内头部大模型(通义千问、盘古)的优化支持,争取在特定场景实现性能不低于 CUDA 平台的效果。其优势是垂直整合深度高、性能优化针对性强;劣势是生态独立,国际通用性差,新兴开源社区项目的支持落后。
海光 DCU 的策略是拥抱 ROCm 开源生态——ROCm 是 AMD 开源的 GPU 计算平台,提供了 HIP(Heterogeneous-computing Interface for Portability)编程接口,HIP 代码与 CUDA 代码高度相似,大量 CUDA 代码可以通过自动转换工具(hipify)转换为 HIP 代码。海光 DCU 与 ROCm 的深度兼容,意味着开发者从 CUDA 迁移到海光 DCU 的工程量相对最小,这是海光在商业客户中推广的核心卖点。
寒武纪的策略是提供 CUDA 兼容层——其 MagicMind 框架提供了对主流 AI 框架(PyTorch、ONNX)的接口兼容支持,开发者使用标准 PyTorch 代码,由 MagicMind 负责在后端将计算任务映射到寒武纪硬件。这一"黑盒兼容"策略降低了开发者的迁移门槛,但可能在算子性能上不如针对寒武纪原生 SDK 优化的代码。
整体来看,国产 GPU 软件生态的成熟度与 CUDA 的差距,在数量级上仍是五至十年的积累差距,无法在两三年内完全弥合。但这并不意味着国产 GPU 没有商业价值——在特定场景(政府、国央企、已针对国产平台深度优化的大模型应用)中,国产 GPU 的性能已经足够满足需求,且在安全可信、供应可控等维度上具有无法用性能差距量化的战略价值。
AI 算力"碳足迹":一个正在快速升温的议题
大模型训练的碳排放,正在从学术探讨演变为企业合规和公众压力的现实议题。以训练一个典型的千亿参数大模型为例:需要数千张 GPU 持续运行约一至三个月,总电力消耗约在一百至五百兆瓦时之间;按中国当前电网平均碳排放强度(约 0.55 kg CO₂/kWh),单次训练产生的 CO₂ 排放约在五十至两百七十吨之间——约相当于三十至一百八十辆普通乘用车行驶一年的碳排放。随着大模型的参数规模不断扩大(GPT-4 级别模型的训练消耗已达数千兆瓦时),AI 训练的碳足迹已经成为一个不容忽视的环境议题。
中国头部 AI 公司(阿里、腾讯、华为、百度)已开始在企业 ESG 报告中披露 AI 算力相关的碳排放数据,并将绿电占比纳入数据中心采购决策的硬性要求。这一趋势正在促使:大模型训练任务向绿电比例高的西部算力节点迁移(贵州水电、内蒙古风电);液冷设备和数据中心节能技术的采购优先级提升;国产 GPU 在单位算力能耗比(Performance/Watt)上的优化压力加大。"绿色算力"从商业噱头演变为监管和市场双向施压的约束条件,这一趋势将在未来五年内进一步强化。 液冷技术路线的选择逻辑:冷板 vs 浸没的 TCO 对比
在实际工程决策中,数据中心运营商选择冷板液冷还是浸没液冷,是一个复杂的总拥有成本(TCO)优化问题,而非纯粹的技术偏好问题。以下是一个典型的五年期 TCO 对比框架:
以一座 1000 架 GPU 服务器机房(单机柜 40 kW,总 IT 负载 40 MW)为例:
冷板液冷方案:一次性改造成本约一千五百万至两千万元(含 CDU 设备、管路改造、冷却液、安装调试);年度运营节省(相对风冷)约两千万至三千万元(电费节省,PUE 从 1.5 降至 1.2,节约约一千五百万元 + 减少空调设备维护约五百万元);五年累计净节省约六千万至一点三亿元,回收期约六个月至一年,是目前最优的改造 ROI 方案。
浸没液冷方案:一次性投资成本约八千万至一点五亿元(含浸没槽体、氟化液/矿物油采购、机房结构改造、CDU);年度运营节省约三千万至四千万元(PUE 从 1.5 降至 1.05,电费节省约两千五百万元 + 大幅减少机房空调设备);五年净节省约七千万至一点三亿元,回收期约两至四年。
两种方案的五年 TCO 差异在于:冷板液冷改造成本低、回收期短,是存量数据中心改造的优先选择;浸没液冷初始投资高,但在 100 kW+ 超高密度场景中冷板液冷物理上无法满足需求,因此浸没液冷是新建超高密度 AI 训练机房的唯一选择。这也是为什么市场普遍预测:未来五年冷板液冷主导存量改造市场(体量更大),浸没液冷主导新建高密度 AIDC 市场(单价更高)。
数据中心网络架构的演变:从三层到叶脊架构
数据中心内部网络架构,在过去十五年内经历了一次深刻变革——从传统的三层架构(核心层-汇聚层-接入层)向叶脊架构(Leaf-Spine)的彻底转型。
传统三层架构在大规模服务器横向流量(East-West Traffic,服务器之间的通信)上存在根本性瓶颈:流量路径长(最多需经过核心层、汇聚层、接入层三层交换),延迟高,带宽利用率低。这在以"用户请求-服务器响应"为主的传统 Web 应用中尚能接受,但在 AI 训练集群中,GPU 之间每隔毫秒就需要交换模型参数更新,横向流量是纵向流量的数十倍,三层架构完全无法满足需求。
叶脊架构(Leaf-Spine)将所有服务器直接连接到"叶"交换机(Leaf Switch),所有叶交换机再与"脊"交换机(Spine Switch)全互联,任意两台服务器之间的通信路径固定为两跳(经过各自的叶交换机和一台脊交换机),延迟极低且可预测,带宽均匀可扩展。现代大规模 AI 训练集群的网络,几乎全部采用叶脊架构,并在此基础上叠加 InfiniBand(超低延迟)或 RoCE(基于以太网的 RDMA)协议实现 GPU 间的超低延迟通信。
在光模块层面,叶脊架构的大规模部署,是推动 400G/800G 高速光模块需求爆发的直接驱动力——一座万卡 GPU 集群的叶脊网络,通常需要数千至数万个 400G 光模块,这也解释了为什么中际旭创、新易盛的光模块订单在二〇二三年至二〇二五年保持爆炸式增长。
余热回收的商业化路径
数据中心余热回收(Waste Heat Recovery)在中国的商业化探索,正在从"概念阶段"向"实际落地"迈进。其技术原理和商业模式如下:
服务器工作时,CPU 和 GPU 的计算热量最终以热水或热气的形式排放到机房外。采用液冷技术的数据中心,冷却液(水)回液温度通常在 35—55 摄氏度之间;采用浸没液冷的数据中心,回液温度可以更高(60—80 摄氏度)。这些热水,如果直接排放到冷却塔,就是废弃的热能;但如果通过热泵系统将温度提升到 60—80 摄氏度以上,就可以并入城市集中供热管网,用于居民冬季供暖或工业热水供给。
北京市通州区已有一个数据中心余热供暖的试点项目——通州某互联网数据中心的液冷回液热量,通过热泵系统提升后,供给周边约三万平方米的居民住宅供暖,每年可减少天然气消耗约两百万立方米,对应减少 CO₂ 排放约三千吨。这一试点的经济账是:供热收入约每年六百万元,热泵系统投资约一千两百万元,回收期约两年。
内蒙古和林格尔的数据中心园区,正在研究更大规模的余热利用方案——将整个园区(总 IT 负载约一千兆瓦)的液冷余热,通过专用管网输送至附近工业园区的蒸汽用户(如食品加工厂、纺织印染厂),实现工业余热与工业用热需求的就近匹配。这一模式若能推广,将使数据中心成为"能源互联网"中一个重要的热量供给节点,从单纯的能源消耗者,转型为能源生产-消费的双向参与者。
AI 运维(AIOps):数据中心自我管理的新范式
大型数据中心的运维管理,传统上依赖大量人工值守(7×24 小时的机房巡检、手工执行的配置变更、基于经验的故障排查),这在机柜数量和服务器数量不大的时代尚可为继,但当一座数据中心拥有十万台以上服务器、覆盖数万架机柜时,人工运维的极限已经到来。
AIOps(Artificial Intelligence for IT Operations)是将机器学习和大数据分析用于 IT 运维的一类技术体系。在数据中心场景,AIOps 的主要应用包括:
预测性维护:通过对服务器、存储设备、网络设备的传感器数据(温度、振动、电压、错误率)进行实时采集和模式识别,提前数天预测潜在硬件故障,在设备实际宕机前完成预防性更换,大幅降低非计划停机时间。谷歌数据中心的 AIOps 系统已将预测性维护的准确率提升到九十五%以上。
能效优化:通过分析服务器负载分布、机房温度场分布和空调系统的运行状态,动态调整空调出风温度和风量,在保障热管理安全的前提下,实时最小化 PUE。谷歌在其数据中心使用 DeepMind AI 对冷却系统进行控制,最终实现了约四十%的冷却能耗降低,这是 AIOps 应用最成功的案例之一,并已在多个谷歌数据中心推广。
容量规划:基于历史算力使用数据和未来业务增长预测,提前六至十二个月预测数据中心各区域的算力容量需求,指导新机柜部署和扩容计划,避免局部过热(因局部过载引发服务器降频)和资源浪费(过度预留冗余算力导致利用率过低)。
自动化故障处理:当监控系统检测到故障(服务器硬件失效、网络链路中断、存储设备报错),AIOps 系统自动执行预定的处理流程——迁移工作负载、隔离故障节点、通知相关责任人、生成故障报告——整个过程可以在分钟级内完成,而人工响应通常需要数十分钟至数小时。国内大型 IDC 运营商(万国数据、润泽科技)均在自研或引入 AIOps 系统,降低运维人力成本,提升服务水平协议(SLA)达标率。
第十章 风险图谱:六类系统性威胁的深度评估
一、美国 GPU 制裁风险:供应链的最大不确定性
美国对华半导体出口管制是中国数据中心行业最大的单一外部风险。H100/H200/B100/B200 全线禁运,H20 在二〇二五年四月追加限制,意味着中国市场已完全无法通过正规渠道获得 NVIDIA 任何性能相当的 GPU。理论上特朗普政府可能松绑部分管制(研究表明 H200 出口争议不断),但只要管制框架整体存在,不确定性就不会消除,任何试图依赖进口 NVIDIA 算力的长期商业计划都是脆弱的。
对国内 IDC 运营商而言,GPU 管制的主要影响是:现有 NVIDIA GPU 库存价值迅速攀升(成为稀缺品,二手 H100 价格远高于国际市场),运营商持有 NVIDIA GPU 的 AIDC 资产增值;新建智算中心被迫切换至国产 GPU,供应链可靠性、软件生态兼容性风险被迫转移至国产厂商。对大模型公司而言,NVIDIA 供应中断意味着训练算力扩展速度受限,在新模型研发竞赛中可能落后于海外拥有完整 Blackwell 集群的竞争对手。中长期看,GPU 管制是推动国产算力生态成熟的最强外部催化剂,但也是不可消除的战略脆弱性。
二、国产 GPU 工艺天花板风险:制程差距的物理约束
国产 GPU 面临的最根本约束,是中国半导体制造工艺与台积电的代际差距。当前最先进的国内晶圆厂(中芯国际)量产的最先进制程约为 7nm 等效,而台积电已量产 3nm,N2 即将量产,在功耗效率和面积密度上相差约两代。这意味着同等算力的国产芯片,芯片面积更大(成本更高)、功耗更高(热密度更高,散热设备压力更大),在极限算力场景下的竞争力存在物理上限。
突破工艺天花板的路径有两条:一是国内晶圆厂加速追赶,这需要突破光刻机等设备的限制(ASML EUV 受荷兰政府管制,中国迄今仍无法获得),时间周期以十年计;二是在架构创新上绕过工艺劣势,通过 Chiplet 多Die互联、先进封装(CoWoS 类技术)在封装级提升系统算力,这是中国芯片厂商当前最可行的技术路线,但同样需要几年时间才能成熟。国产 GPU 的工艺天花板,是中国数据中心行业中期(2025—2030)最重要的技术风险。
三、大模型商业化不确定性:高算力需求的需求侧风险
数据中心的投资逻辑,很大程度上建立在大模型商业化加速的假设上——更多大模型落地企业,就意味着更多 GPU 小时的推理算力需求。但大模型商业化进程存在显著不确定性:大多数企业级大模型部署项目仍处于"试点"或"小规模采购"阶段,真正产生可观算力账单的头部客户(腾讯、百度、字节、阿里等互联网平台)同时也是自建算力的主体,并不主要依赖第三方 IDC;大量传统行业的大模型 POC(概念验证)项目能否转化为长期算力订单,取决于 ROI 是否清晰。如果大模型商业化进程慢于预期,二〇二四年至二〇二五年快速扩张的 AIDC 产能可能出现局部过剩,影响租金和使用率。
四、PUE 与能耗管控的合规压力
PUE 政策约束不仅是技术挑战,更是合规风险。若现有数据中心无法在规定时限内将 PUE 降至 1.3 以下,可能面临限制新增机柜审批、被地方政府列入整改清单等行政风险。数据中心配电和数据中心制冷的系统性改造,需要大量资本支出,且可能导致数月的停机期,对强依赖可用性的运营商而言,改造窗口安排是一个重大运营挑战。部分老旧数据中心(尤其是十年以上的资产)若改造成本过高,可能面临被迫退出的命运,这既是风险(存量资产减值)也是机遇(市场集中度提升)。
五、海外政治风险:地缘博弈下的出海受阻
中国 IDC 企业出海在二〇二五年以后将越来越多地面临地缘政治风险。东南亚各国政府(尤其是印度尼西亚、越南)对中国科技企业的数据安全审查趋于严格;部分国家(印度)已有实质性的禁止或限制中国科技企业直接投资数据中心的政策倾向;即便是政策相对友好的马来西亚,也在二〇二五年对数据中心用电配额实施管控,优先保障本地需求,部分中国企业的扩容计划受到影响。欧洲市场(德国、荷兰、法国)对外资数据中心的审查日趋严格,GDPR 合规成本高,中国企业的直接投资几乎没有先例。
六、客户集中于超大型平台的商业风险
头部 IDC 运营商(万国、润泽、奥飞)的客户高度集中于字节跳动、腾讯、阿里、百度等少数超大型平台客户,前三大客户通常贡献总营收的五十%至七十%。这一模式的优点是合同期长、付款稳定,缺点是议价能力弱、客户迁出或自建风险大。事实上,腾讯、阿里、字节近年来均在持续提升自建 IDC 比例,减少对第三方的依赖。一旦某个大客户在合同到期后不续租,对中小型 IDC 运营商而言可能是致命打击;对头部运营商而言,如何在维持大客户关系的同时,分散客户集中度,是长期商业战略的核心命题。
第十一章 2026—2030 预测:五大趋势的演进路径
趋势一:算力规模继续高速增长,向千亿 EFLOPS 量级迈进
以当前约四十%的年复合增长率估算,全国总算力规模(以智能算力为主体)有望在二〇二七年至二〇二八年突破一千 EFLOPS,到二〇三〇年可能达到三千至五千 EFLOPS,超越美国成为全球算力规模第一的国家(但芯片性能差距仍可能导致实际有效算力仍落后)。东数西算战略将继续深化,西部节点算力占比有望从当前的约五十%提升至六十%以上,算力成本随竞争加剧持续下降,公有云 GPU 小时计价将进一步下探。
趋势二:国产 GPU 市场份额提升至 60% 以上
随着华为昇腾 960 系列(预计二〇二七年问世)、寒武纪 MLU700 系列、海光 DCU 8 代等次世代国产算力卡相继量产,加上软件生态(国产 AI 框架、算子库、编译优化工具链)的持续完善,国产 GPU 在中国市场的综合份额有望从二〇二五年的约四十一%提升至二〇二八年的约六十%以上,并在政府、国有金融、能源等国央企场景实现九十%以上的替代。但在互联网头部大厂(对极限算力性能有最高要求的场景),NVIDIA 或其继任者(若出口管制松动)仍将保有一定市场。
趋势三:液冷渗透率突破 50%,浸没液冷走向主流
随着 Blackwell 后继架构("Rubin"系列,预计二〇二六年发布)将 GPU 功耗推向更高水平,以及中国 AI 大模型持续对极限训练算力的追求,新建数据中心的液冷渗透率将从二〇二五年的约二十%快速提升至二〇二七年的四十%、二〇三〇年的五十%至六十%。浸没液冷的成本随规模效应和冷却液本土化生产而持续下降,预计二〇二八年前后将与冷板液冷在总拥有成本(TCO)上基本持平,届时浸没液冷将成为新建超大型数据中心的主流选择。液冷设备和散热系统相关制造商将迎来持续五年以上的高速成长期。
趋势四:PUE 1.2 全面普及,绿色算力认证成标配
在国家政策的强制推动和市场竞争的双重压力下,二〇三〇年中国新建大型及以上数据中心的平均 PUE 有望降至 1.2 以下,存量数据中心的 PUE 均值从目前的约 1.5 降至 1.3 以下。绿色算力认证将从自愿性向强制性或准强制性过渡,不具备绿色算力认证的 IDC 在争取大型跨国客户和政府采购时将面临明显劣势。风光水储配套的绿色能源供应将与数据中心园区深度融合,"绿色算力"将成为数据中心选址和品牌竞争的核心要素。
趋势五:出海加速,东南亚和中东成主战场
中国 IDC 企业在海外的扩张将以东南亚(马来西亚、印度尼西亚、泰国)和中东(阿联酋、沙特)为主攻市场,依托"数字丝绸之路"政策框架,推动中国的数据中心设计、机房建设方案、液冷设备、UPS电源等基础设施产品走向全球。到二〇三〇年,头部中国 IDC 运营商海外收入占比有望提升至二十%至三十%,成为真正意义上的国际化企业。海外市场的竞争将以本地化合规和本地化运营能力为核心壁垒,先期布局积累本地经验的企业将形成显著先发优势。
关于 AI 数据中心供给过剩风险的判断
一个值得关注的反向风险是:如果大模型商业化进程不如预期、若干国产 GPU 量产遭遇技术挫折、或全球宏观经济下行导致科技资本开支收缩,二〇二四年至二〇二六年快速扩张的中国 AIDC 产能可能出现局部过剩,部分节点(尤其是网络时延不占优势的西部节点)的上架率可能长期偏低,给投资人带来损失。这一风险不是洪水猛兽,但在当前供给扩张高峰期,值得保持警惕。产能过剩的出清往往伴随行业并购,并最终推动市场格局的进一步集中——这在中国互联网数据中心行业的上一轮(2015—2018)扩张期已经上演过一次。
第十二章 研究结论与战略判断
中国数据中心与 AI 算力行业,正在经历的不是一轮普通的资本支出扩张,而是一次底层基础设施的范式迁移——从"存储数据的机房"变成"运算智能的算力网络",从"为 IT 部门提供外包服务"变成"为全社会的数字化生产力提供基础底座"。这一迁移,在规模上将超过此前任何一轮 IDC 扩张,在技术复杂度上将远超传统数据中心行业的运营经验积累,在政策密度上将是中国历史上对单一行业干预最密集的领域之一。
五条结构性判断
第一,算力是新时代最重要的生产要素之一,市场长期向好。大模型商业化虽有波动,但"企业需要 AI 能力→AI 需要算力→算力需要数据中心基础设施"这条逻辑链在中国市场的确定性极高,政府政策、产业需求、资本投入三者共振,市场规模中期(至二〇三〇年)有望达到一点二万亿元。
第二,国产 GPU 替代是最确定的中期主题,但路径非线性。美国出口管制把替代窗口强制打开,但从"能用"到"好用"到"与 NVIDIA 同台竞技",国产 GPU 至少还需要两到三代迭代,五至八年的时间维度。短期内,政府、国央企场景的替代已基本完成;长期看,互联网头部大厂是最难突破的堡垒,其选择最终取决于性能差距能否缩小到商业可接受范围内。
第三,液冷是最确定的技术趋势,供应链国产化机遇显著。液冷渗透率的提升没有逆转可能——单机柜功率密度只会上升不会下降。中国液冷供应链已经从零起步,在七年内培育出了曙光数创、高澜股份等全球有竞争力的玩家,这条赛道的国产化率将继续提升,出口潜力同样值得关注。
第四,东数西算战略格局已基本奠定,区域分工进一步清晰。东部节点以高时延敏感业务(金融、互联网实时服务、工业边缘)为核心,供给受限、价格高企,优质存量资产具有明显稀缺价值;西部节点以大规模批处理(训练任务、数据湖存储、冷数据备份)为核心,成本优势突出,上架率将随市场成熟而持续提升;海外节点以东南亚和中东为优先,逐步形成中国算力向全球延伸的"算力出海"格局。
第五,行业集中度将继续提升,中小 IDC 面临整合压力。资本密集型、技术密集型的 AIDC 建设,天然有利于具备资金实力和技术能力的头部运营商,中小型通用 IDC 若无法完成液冷改造和 AIDC 升级,将逐步失去大客户,最终被并购或退出。这一集中化趋势,在中国 IDC 行业的三次扩张周期中都是重复出现的历史规律。
一个研究院的长期视角
天下工厂产业研究院在梳理中国制造业与基础设施赛道时,始终持有一个核心信念:支撑一个行业长期增长的,不是某一家企业的技术领先,也不是某一轮政策的短期刺激,而是供应链的厚度——有多少家工厂、多少类技术、多少条产业链在协同支撑。数据中心行业的全产业链,从数据中心机柜的钢铁制造,到AI服务器的精密电子装配,到液冷设备的热管理工程,到光模块的精密光电制造,每一个环节都在中国形成了完整的本土化供应链。这张供应链网络的密度和韧性,是中国数据中心行业能够在全球 GPU 出口管制和供应链重组的压力下,仍然保持高速扩张的根本支撑。
算力的争夺,从某种意义上说,是制造能力的另一个战场。中国的 480 万家真实工厂,是这场算力竞争最坚实的后盾。
数据来源与主要参考
本报告基于产业平台工厂与产业链数据,结合公开年报、权威机构报告与主流媒体报道整理、分析。数据新鲜度基线:公司年报数据取 FY2025(多数企业已于 2026 年一季度完成披露);行业数据取 2025 全年及 2026 年一季度最新数据;政策事件以 2026 年 6 月为截止时点。
主要数据来源包括:
- 天下工厂产业平台工厂数据库(www.tianxiagongchang.com)
- 润泽科技(300442)2025 年年度报告(新华网,2026 年 4 月)
- 光环新网(300383)2025 年年度报告(新浪财经,2026 年 4 月)
- 奥飞数据(300738)2025 年年度报告(新浪财经,2026 年 4 月)
- 浪潮信息(000977)2025 年前三季度报告及 2024 年年报(各官方公告)
- 中科曙光(603019)2025 年前三季度报告
- 宝信软件(600845)2025 年年度报告(新浪财经,2026 年 3 月)
- 海光信息(688041)2025 年业绩数据(证券之星)
- 寒武纪(688256)2025 年年度报告(证券时报)
- Equinix Inc. FY2025 quarterly press releases(SEC Filings,2025 年各季度)
- Digital Realty Trust FY2025 quarterly press releases(SEC Filings,2025 年各季度)
- CoreWeave Inc. FY2025 Form 8-K quarterly releases(SEC Filings,2025 年各季度)
- 中国信息通信研究院《算力中心服务商分析报告(2025 年)》
- 国家发展改革委《数据中心绿色低碳发展专项行动计划》(2024 年 7 月)
- 国家数据局《体系化推动算力电力协同》(2025 年 3 月)
- 头豹研究院《2025 年中国绿色算力行业概览》
- 智研咨询《2025 年中国数据中心行业市场规模及竞争格局》
- 36 氪《国产 AI 芯片崛起:三大门派瓜分英伟达》(2025 年)
- Council on Foreign Relations 《China's AI Chip Deficit》报告
- MUFG Americas AI Chart Weekly(2025 年 12 月)
- 新华网、证券时报、21 财经等权威媒体相关报道 美国出口管制的长期结构影响:不只是芯片,是生态
把美国对华 GPU 出口管制仅仅理解为"买不到 NVIDIA 的芯片",是对这一政策深度影响的严重低估。出口管制的结构性影响,渗透到了整个 AI 价值链的多个层级:
第一层影响(已发生):高性能 GPU 短缺,国产替代加速。这是最直接、最显性的影响,已被广泛讨论。
第二层影响(正在发生):AI 软件生态分裂。CUDA 生态长期以来是全球 AI 开发者的统一语言,NVIDIA 出口管制迫使中国的 AI 开发者越来越多地转向国产算力(昇腾/CANN、海光/ROCm)。这一迁移的副产品,是中国 AI 软件生态正在与全球主流 CUDA 生态渐行渐远——中国开发者积累的大量基于国产 SDK 的代码和优化经验,无法轻易迁移回 CUDA,反过来,国际开源社区针对国产 SDK 的支持也更少。这一"软件生态分裂"在短期内增加了开发成本,但长期看可能在中国孵化出一套独立的 AI 基础软件体系。
第三层影响(潜在影响):AI 研究能力的代际差距。顶级大模型的训练,依赖对最前沿 GPU 架构(如 Blackwell 的 NVLink 互联、HBM3E 超宽带宽)的深度优化——只有实际持有这些 GPU 并进行大量实验的团队,才能掌握最前沿的训练技术诀窍(know-how)。如果中国 AI 研究机构长期无法访问最先进 NVIDIA 架构,可能在某些对硬件特性高度依赖的研究方向(如超大规模预训练技术)上,积累系统性的落后。这是出口管制最深、也最难量化的长期影响。
国产 GPU 的良品率与供应链稳定性风险
国产 GPU 爆发式增长的背后,有一个鲜少被公开讨论的隐患——量产良品率和供应链稳定性。以寒武纪 MLU590 和海光 DCU 为例,其核心芯片均在中芯国际或相关国内代工厂生产。相比台积电的量产工艺,国内代工厂在先进制程(7nm 等效)的良品率仍存在一定差距,这意味着有效算力的实际供给量,可能低于出货的芯片数量乘以设计算力的理论值。
供应链稳定性风险体现在:国内先进制程晶圆产能集中于中芯国际,一旦中芯国际因任何原因(产能问题、设备维护、进一步制裁)出现供应中断,整个国产 GPU 生态都会受到冲击,没有可替代的国内备用产线。这一单点脆弱性是整个国产算力生态在中期(二〇二五年至二〇二八年)最重要的供应链风险,亦是 IDC 运营商在大规模转向国产 GPU 时必须纳入评估的采购风险因素。
中小 IDC 的生死局:三种命运
中国大量中小型 IDC 运营商(机柜数量五百至五千架,年收入一亿至十亿元)正在面临一场生死洗牌,其最终命运基本分为三类:
第一类:成功转型 AIDC,实现溢价生存。具备以下条件的中小 IDC 有可能完成转型:地处核心城市(北京、上海、深圳、杭州)周边、土地自持、电力接入容量有余量、有大型互联网客户的稳定关系。这类 IDC 通过引进液冷技术、部署 GPU 服务器集群,将自己改造为"精品 AIDC",以远高于传统 IDC 的单价服务于中型 AI 企业客户。
第二类:被并购整合,成为头部运营商的区域节点。随着 IDC 行业集中度提升,具有优良地理位置(核心城市高价值土地)但无力独立完成 AIDC 升级改造的中小运营商,会成为头部运营商(万国、润泽、世纪互联)的收购对象,以土地和机房资产入场,换取头部运营商的资金、技术和客户资源。这一整合浪潮在二〇二四年至二〇二六年正在加速。
第三类:流失客户、被迫退出。无法转型、也没有被并购机会(地段一般、资产老旧、客户不稳定)的中小 IDC,将在大客户迁出(转向更现代化的 AIDC 或头部运营商)后面临高空置率和财务压力,最终关闭或被低价出售。光环新网二〇二五年的业绩压力,部分反映了这一结构性风险在头部公司中的早期迹象。
客户集中度风险的真实案例:腾讯的自建策略
腾讯在二〇二一年至二〇二五年间大幅提升了自建数据中心的比例。其自建数据中心(主要布局在天津、贵安、上海、广州、成都、芜湖)的新增产能,已能满足其约八十%的新增算力需求,对第三方 IDC 的依赖从高峰期的约四十%降低至约二十%以下。这一调整,意味着以腾讯为大客户的 IDC 运营商(如世纪互联北京区域的部分项目),需要在腾讯续约率降低的同时,找到替代大客户——这在当前市场上并不容易,因为能够一次性租用数千架机柜的超大型客户数量本来就极为有限。
腾讯自建数据中心的底层逻辑是:规模够大之后,自建的长期成本低于外包(省去了第三方运营商的利润层,约相当于总成本的十五%至二十五%);自建还提供了更高的安全性(数据不经过第三方)和更大的定制化自由(可以按自身需求设计机房布局、冷却方案、网络架构)。同样的逻辑,字节跳动、阿里也在持续提升自建比例,进一步挤压第三方 IDC 市场的增量空间。
海外政治风险的量化框架
评估中国 IDC 运营商的海外政治风险,需要一个系统性的量化框架,而非仅凭直觉判断。以下是一套可操作的评估维度:
目标市场政府立场(权重三十%):该国政府对中国科技企业的总体立场是否友好?历史上是否有过限制中国投资的案例?是否签署了数据安全相关的双边协议或加入了可能限制中国科技设施的多边框架?
数据本地化法律要求(权重二十%):该国是否要求特定行业的数据强制存储在境内?数据中心的外资股权是否有限制?是否允许数据向中国境内服务器传输?
电力配额与能源政策(权重二十%):该国是否对外资数据中心的电力配额有特别管控?可再生能源供给是否充足?电价稳定性如何?
市场需求基础(权重三十%):目标市场的数字化增长速度是否支撑 IDC 投资的回报预期?本地竞争对手的能力是否构成实质性挑战?中国企业在当地的品牌可接受度如何?
按这一框架,马来西亚综合评分最高(政府友好、需求旺盛、电力政策稳定、无严格外资限制),是中国 IDC 运营商出海的最优先市场;印度评分最低(限制中国投资、数据本地化严格、竞争激烈);中东(阿联酋、沙特)评分居中偏高,政府友好、财力强但市场规模相对有限;欧洲评分偏低(监管严格、GDPR 合规成本高、政治敏感性强)。 算力市场的长周期视角:从建设期到运营期的行业成熟
理解数据中心行业的长周期,需要借鉴电信行业的历史规律。一九九九年至二〇〇一年,全球曾经历一次剧烈的光纤与数据中心过度投资浪潮(互联网泡沫),大量数据中心建好后空置,大量光纤铺好后未被点亮,造成了十亿美元级的资产减值。这一轮泡沫在二〇〇一年破裂,但催生的光纤和机房基础设施,在随后的十年里(二〇〇三年至二〇一三年)被廉价利用,支撑了宽带互联网的高速普及和谷歌、亚马逊、Meta 的崛起。
当前中国 AIDC 的建设速度,与那次互联网泡沫有些结构性相似之处——资本大规模涌入、建设快于需求爬坡、部分西部节点已出现过剩苗头。但也有根本性的不同:当前的算力需求是真实且快速增长的(大模型商业化远比当年的互联网应用更快落地),国家政策的系统性支持比二〇〇〇年代的互联网产业更具方向性,且头部玩家的资金实力和风险抗性远强于当年的初创公司。因此,即便局部出现过剩,行业整体的自我修复能力更强,过剩期的持续时间会更短,出清后形成的格局会更集中,对行业长期发展的破坏性远小于互联网泡沫。
算力出口:中国制造的全球输出
在讨论中国数据中心行业的未来时,有一个常被忽视的增长维度——算力出口。中国在数据中心基础设施制造(数据中心机柜、UPS电源、精密空调、散热设备)领域已经是全球最大的供应基地,大量基础设施设备出口至东南亚、中东、非洲在建的数据中心项目。
在 AI 服务器领域,尽管 NVIDIA GPU 出口受限,浪潮信息、中科曙光的服务器(搭载 AMD EPYC CPU、非管制 GPU 或国产 NPU)仍在向东南亚、中亚、中东的数据中心出口。更长远看,如果国产 GPU 性能继续提升且美国出口管制不扩展至中国研发的算力产品本身,中国 AI 服务器有可能在"全球南方"(Global South)国家中形成较大的市场份额,成为这些国家构建 AI 基础设施的"经济适用选择"。
这一出口逻辑与中国高铁、5G 基础设施出口的逻辑相似:美国方案性能领先但价格高昂,中国方案性价比高且具备充足的工程交付能力。在算力市场,"够用的算力 + 更低的价格 + 更快的交付",对众多发展中国家将是有竞争力的解决方案。
国产光模块:最被低估的全球竞争优势
在数据中心产业链中,中国在一个细分领域已经取得了不亚于液冷的全球领先地位——高速光模块制造。中际旭创(300308)和新易盛(300502)是全球 400G/800G 高速光模块市场的头部供应商,它们的客户包括 AWS、谷歌、微软、Meta——全球最顶尖的数据中心运营商,毫无疑虑地将最核心的光通信设备采购从中国工厂。
高速光模块是数据中心网络互联的"神经末梢",每个交换机端口都需要一个光模块将电信号转换为光信号并通过光纤传输。随着 400G 以太网在数据中心叶脊架构中成为标配,以及 800G 光模块进入量产阶段,光模块市场需求与 GPU 服务器出货量高度正相关,是数据中心算力扩张最直接的受益设备之一。
中国光模块企业在这一领域的竞争优势,来自以下几个层面:大规模制造能力(中国拥有全球密度最高的光电子制造集群,主要集中在武汉光谷)、工艺积累(核心员工大量来自武汉邮电科学研究院系的技术传承)、快速响应新规格(800G 光模块从研发到量产的速度,国内领头企业明显快于美国竞争对手 II-VI/Coherent)。在出口管制的背景下,光模块至今没有受到额外限制,这一"豁免"使中国光模块制造商能够继续在全球最顶尖市场参与竞争,是中国数据中心供应链全球竞争力的重要体现。
中国 IDC 行业的人才供给:一个结构性短板
在资本和技术之外,数据中心行业有一个结构性短板在宏观讨论中鲜少被关注——人才供给不足。运营大型 AIDC 需要一批兼具数据中心运营经验(机房电气、制冷系统维护)和 AI 基础设施运维能力(GPU 集群调度、分布式存储运维、AI 框架调优)的复合型人才,这类人才在全国总存量极为有限,且头部互联网公司(字节、腾讯、阿里)的人才吸附能力极强,独立 IDC 运营商难以招募和留住。
这一人才短缺在中国西部节点表现尤为突出——贵安、乌兰察布、庆阳的 GDP 规模和薪资水平,难以与北京、上海竞争 GPU 集群运维工程师,导致部分西部节点建好后维持高质量运营的难度远高于东部节点,不得不依靠大量远程运维(通过网络远程管控机房,只在关键故障时派遣现场工程师),这对运维效率和服务质量都构成制约。
解决这一短板,需要高校增加数据中心运维专业课程(目前全国专门开设该方向的高职院校仍极少)、IDC 运营商与高职院校建立联合培养机制,以及通过 AIOps 等技术手段降低对人工运维的依赖。这将是二〇二六年至二〇三〇年期间行业快速发展的重要配套短板之一。
投资视角:数据中心产业链的不同风险收益特征
从投资视角审视数据中心产业链,不同环节的风险收益特征存在显著差异,值得分类讨论:
高确定性、低弹性:UPS电源、配电柜、数据中心机柜、机房空调等基础设施设备,需求与 IDC 建设同步增长,国产化率高,竞争格局稳定,是数据中心扩张中最确定的受益方,但估值倍数通常不高(PE 十五至二十五倍),适合追求稳健回报的长期配置。
高确定性、高弹性:液冷设备(冷板液冷和浸没液冷)处于技术渗透的爆发期,需求增速远高于 IDC 整体建设速度,且国内供应商数量有限、格局尚未固化,是最具弹性的细分赛道,适合成长型投资者。
高弹性、高风险:国产 GPU(寒武纪、海光、摩尔线程),增速弹性极大,但工艺天花板、软件生态、客户结构均存在不确定性,估值波动剧烈,适合风险承受能力较高的成长型投资者,需要高度关注技术进展和竞争格局变化。
高现金流、低成长:头部 IDC 运营商(润泽、万国、世纪互联),资产价值稳定,现金流可预测,但资本支出规模庞大,净利润增速与营收增速存在较大差距,类似 REIT(房地产信托)的特征,适合追求稳定股息和资产增值的机构投资者。
光模块领域:中际旭创、新易盛,全球市场地位确定、需求高速增长,但因客户高度集中(前三大客户均为超大型美国云厂商)且存在中美贸易摩擦的政策风险,估值折扣持续存在。在政策风险可控的前提下,是兼具弹性和确定性的优质标的。
理解这张风险收益矩阵,是在数据中心赛道做投资决策的基础框架。没有哪个细分环节是"只赚不赔"的,但每个细分环节的核心驱动力和风险因素都是可以系统性分析的。 算力政策的深层机制:国家意志与市场机制的协同
理解中国数据中心行业的发展逻辑,必须理解中国特色的"国家意志 + 市场机制"协同机制。这与美国(几乎纯市场驱动)和欧盟(强监管框架下的市场驱动)都截然不同,但也不是苏联式的全面计划经济。
中国的算力政策框架,在宏观层面由国家发展改革委、工业和信息化部、国家数据局、国家能源局联合制定,形成顶层战略框架(东数西算、绿色低碳、国产替代);在中观层面由各省市政府负责将国家指标分解落实(算力规模指标、PUE 达标时间、上架率目标),形成省级算力规划;在微观层面,市场化的 IDC 运营商、云服务商和算力投资基金,在政策框架内按照商业逻辑进行投资决策。
这一机制的优势是:政策确定性高(五年规划赋予了市场参与者足够的长期预见性,降低了不确定性溢价);建设速度快(政策加持下,西部节点的土地审批和电力接入速度远超自由市场条件);资源协调能力强(国家可以动员国有银行提供低成本融资、地方政府提供配套支持,降低项目资本成本)。
劣势是:可能产生非效率投资(政策指配的算力建设需求不一定能转化为市场化的付费需求,西部节点早期上架率低就是典型案例);运营商可能过于依赖政策保护,缺乏在国际市场竞争的内在驱动力;政策转向风险(若双碳目标、数字经济政策或国产替代政策发生调整,建成的基础设施可能面临资产搁浅风险)。
认识到这一机制的优劣,是评估中国 IDC 投资的重要基础。纯用美国市场的分析框架去评估中国 IDC,会低估政策驱动的建设加速度;纯用计划经济的视角去看,又会高估行政命令对商业模式的可持续性的保障程度。最准确的视角是:在中国,政策是算力投资的必要条件,但不是充分条件;市场需求是充分条件,需要持续追踪和验证。
人工智能算力需求的弹性与刚性
大模型商业化给 IDC 行业带来的需求,不同于传统互联网应用,其中有刚性成分也有弹性成分,需要加以区分。
刚性需求(不受短期经济周期影响):政府算力基础设施建设(各省智算中心规划已审批项目)、国央企数字化转型(有财政保障)、三大运营商的 5G MEC 边缘算力(运营商主导,资金充沛)。这部分约占中国 IDC 新增需求的三十%至四十%,稳定性极高。
半刚性需求(受行业政策影响大):金融行业 AI 化(监管导向显著)、医疗健康数字化(政策推动明显)、工业互联网("智改数转"政策强制推动)。这部分约占新增需求的二十%至三十%,受行业监管政策调整影响较大。
弹性需求(受商业化进度影响大):大模型商业化推理算力、AI 创业公司的算力采购、AI 训练算力的二次扩容(大模型迭代驱动)。这部分约占新增需求的三十%至四十%,增速最快,但也最受大模型商业化进展和融资环境的影响。
对于 IDC 投资者来说,准确区分自己投资的数据中心主要服务的是哪类需求,是判断收入稳定性和增长前景的关键。服务刚性需求的数据中心(政务云、国央企私有云)现金流稳定但单价低、增速慢;服务弹性需求的 AIDC 收益率高但波动大、上架率预测难度高。在实际的 IDC 资产组合中,这三类需求的合理混搭,是平衡风险和收益的最优策略。
供应链国产化:从受迫到主动
中国数据中心供应链的国产化进程,在二〇二二年前更多是一种"被迫应对"——因为美国的出口管制,不得不用国产芯片替代 NVIDIA,用国内厂商的 UPS 替代施耐德,用国产光模块替代 II-VI。但在二〇二五年,这一进程已经越来越多地呈现出"主动选择"的特征。
以光模块为例:中际旭创、新易盛不是因为 NVIDIA 产品被禁,而是因为其产品在成本、交期和本地服务上具有真实竞争力,成为了 AWS、谷歌全球数据中心的主流供应商。这是技术竞争力驱动的市场选择,而非政策保护的结果。
以液冷为例:曙光数创进入字节跳动供应链,不是因为字节在液冷领域有国产化要求,而是因为其技术方案(整机柜浸没液冷)在交付速度和系统集成能力上,优于国际竞争对手(Vertiv、CoolIT Systems)。这一胜出,代表了中国 IDC 基础设施供应链的能力正在从"够用"走向"更好"。
这种从"被迫替代"到"主动竞争"的质变,是判断中国 IDC 供应链长期竞争力的最重要信号。当国产方案能在没有政策保护的国际市场(AWS、谷歌)中赢得订单,就意味着这条供应链已经具备了真正的市场竞争力,而非仅仅依赖国内市场的保护。
数据中心行业的并购整合浪潮
行业分析师预测,二〇二六年至二〇二八年将是中国 IDC 行业并购整合的高峰期。驱动这一预测的主要逻辑是:
一,头部运营商需要快速扩充在特定核心城市的产能(而审批管控下新建速度有限),并购存量资产是最快的扩产路径。万国数据、润泽等头部运营商均有明确的并购意愿和资金实力。
二,中小型 IDC 在 AIDC 转型升级中的资金缺口,将推动部分中小运营商寻求被并购。流动性不足的中小 IDC 资产,在行业技术代际切换期更容易以合理估值寻找战略买家。
三,国有资本正在加速进入 IDC 赛道。国有银行(建设银行、工商银行)旗下的基础设施基金、国家开发银行支持的产业基金,以及地方国资委,都在积极寻求对 IDC 资产的股权投资机会。国有资本的进入,可能推动部分国有大型互联网平台(如三大运营商、宝信软件)将 IDC 资产装入专用运营主体,进而寻求上市或发行 IDC-REIT 产品,实现资本循环。
这一并购整合浪潮,对于产业发展具有重要的正面意义:它将推动规模化运营(大数据中心的运营效率和单位成本,优于碎片化的小数据中心)、加速标准化建设(头部运营商通常有更完善的运营标准)、提升行业整体的绿色水平(头部运营商有更强的 PUE 改造投入能力)。行业集中度的提升,从长远看是中国 IDC 行业从"粗放扩张"走向"精益运营"的必经之路。
全球 AI 算力版图 2030:中美的两个平行生态
站在二〇二六年的节点上展望二〇三〇年,全球 AI 算力市场正在形成两个相对独立的生态系统:
以 NVIDIA Blackwell/Rubin 生态(配套 TSMC 先进制程、HBM 内存、InfiniBand 互联)为核心的"西方算力体系",主导欧美、日韩、东南亚、印度、中东(部分)市场。这一体系技术领先,但受出口管制约束,对中国市场的渗透日趋有限。
以华为昇腾/海光 DCU(配套中芯国际制程、国产 HBM 替代品、昇腾 RoCE 互联)为核心,辅以寒武纪、天数智芯等补充产品的"中国算力体系",主导中国国内市场,并通过"一带一路"数字项目和"全球南方"科技合作,向部分东南亚、中亚、非洲国家输出。这一体系技术上相对落后(约落后"西方体系"一至两代),但在政策导向市场和成本敏感市场中具有显著竞争力。
两个体系之间的竞争,不只是技术之争,更是商业生态之争和政治联盟之争。哪个国家的政府选择采用哪套算力体系,将决定其未来五至十年的 AI 技术主权立场,以及与不同体系的软件生态和人才体系的深度绑定。这一"算力生态分裂"的深远意义,不亚于当年的互联网分裂(中国防火长城内外的两套互联网生态),可能对全球数字化格局产生深远的重塑效应。
理解这一趋势,是理解未来五至十年全球数据中心与 AI 算力行业竞争格局的根本性前提。 国产 GPU 软件生态的攻坚战:比芯片更难的是生态
在讨论中国 AI 算力的国产化进展时,算力界有一句流传颇广的话:"造出芯片只是万里长征的第一步,跑通软件生态才是真正的胜利。"这一判断,精准地指出了中国 AI 芯片国产化的最核心痛点:硬件可以靠国家战略、砸钱、招人来加速,但软件生态的形成需要时间、开发者和真实场景的打磨,这些东西是无法靠行政命令加速的。
CUDA 的护城河究竟深到什么程度?从数字上看:NVIDIA CUDA 生态有超过四百万注册开发者,超过三十七万个 CUDA 加速的应用程序,深度学习领域主流框架(PyTorch、TensorFlow、JAX)对 CUDA 的底层调用已经深度耦合,绝大多数顶尖的开源模型(Llama、Mistral、Qwen)的推理优化代码,都是首先针对 CUDA 架构写的,适配其他平台只是"顺手"而非"重心"。这意味着,当一家国内 AI 公司想部署一个开源大模型在国产 GPU 上,它面临的挑战不只是换一块显卡那么简单——它需要在一个没有 CUDA 的世界里,重新适配所有的底层算子、重新调试所有的性能优化,而且这些工作还没有太多现成的社区经验可以参考。
华为在这个方向上投入最重、进展最大。昇腾 CANN(Compute Architecture for Neural Networks)是华为自研的算子库和编译器框架,覆盖主流的深度学习算子,支持 PyTorch、MindSpore 等框架的适配。二〇二五年,华为推出了"昇腾 AI 原生支持计划",向超过两百家国内 AI 大模型企业和科研机构提供迁移工具、工程师驻场支持和 O2O 培训,力图降低从 CUDA 迁移到昇腾的工程成本。截至二〇二五年底,百度文心、阿里通义、腾讯混元、科大讯飞星火等主流大模型均已完成在昇腾硬件上的适配与验证,训练和推理性能与 A100 对比约在七十%至九十%之间,差距在可接受范围内。
海光信息走了一条不同的路:兼容 x86 架构和 CUDA 生态的"半兼容"策略。海光的 DCU(深度计算单元)基于兼容 ROCm 的软件栈,理论上可以运行原来运行在 AMD GPU 上的代码,配合国内团队自研的 HYGON HPC-X 通信库和 DNN 算子库,向用户提供一个"尽量少改代码"的迁移路径。这一策略降低了开发者的迁移门槛,但也受限于 ROCm 生态本身的成熟度(ROCm 对主流框架的支持虽然覆盖度相当高,但细节上仍有不少兼容性坑)。
寒武纪的思路更注重"场景先行":集中资源打通推理场景的软件适配(因为推理场景的算子固定、优化更聚焦),在云端推理市场建立标杆案例后,再向训练市场延伸。寒武纪与阿里云、百度智能云、华为云的合作,都是以推理服务为入口建立合作关系,逐步向更复杂的训练场景拓展。这一路径在商业上已经初见成效——寒武纪二〇二五年营收同比增长超过四百五十%,其中相当一部分来自于云端推理实例的规模化部署。
从更长远的视角看,中国国产 GPU 软件生态的竞争策略,正在从"完全兼容 CUDA"(不可能实现的目标,因为 NVIDIA 不开源 CUDA 核心)转向"在中国市场建立独立的、自洽的生态闭环"。这意味着:让中国的主流大模型首先在国产 GPU 上运行良好,让中国的 AI 应用开发者习惯于在昇腾或海光平台上开发,让国内的高校和科研机构基于国产 GPU 培养下一代 AI 工程师。一旦这一"国内生态闭环"成型,CUDA 生态的护城河在中国市场的实际意义就会大幅降低——不是因为国产 GPU 追上了 CUDA 的技术深度,而是因为中国市场的主流用户已经不再需要 CUDA。
大模型"军备竞赛"与算力需求的结构性拉动
理解中国 AI 算力市场的需求侧,不能不理解大模型竞争格局的演化。二〇二四年至二〇二五年,中国大模型市场进入了"百模混战"之后的整合阶段:一线大模型(文心、通义、混元、MiniMax、Kimi、DeepSeek)之间的技术差距正在缩小,竞争焦点从"能不能用"转向"哪个能更低成本、更快速地集成进企业应用"。这一竞争态势,对算力需求有以下三个维度的影响:
训练算力的需求结构从"冲刺型"转向"持续型"。二〇二三年至二〇二四年的算力需求高峰,来自于各家模型厂商第一轮的大模型训练(从零开始训练几千亿参数的基础模型,需要数千到数万张 GPU 连续运行数周至数月)。到二〇二五年,这类"从零开始"的超大规模基础模型训练逐渐减少,取而代之的是"持续增量训练"(基于已有基础模型,持续注入新数据、持续迭代对齐)和"专业化微调"(面向垂直行业的领域模型微调)。前者的单次训练算力消耗减小,但频率更高;后者的算力需求分布更广、参与主体更多(每家有条件的大企业都在做行业模型微调)。这一结构变化,导致算力需求更加"分散化"——不再集中在少数几个超大训练任务,而是分散到上千家企业的模型微调和推理部署中。
推理算力需求进入高速增长期。随着大模型应用(AI 助手、代码补全、AI 搜索、智能客服)的商业化规模扩大,推理算力的消耗量正在以远超预期的速度增长。一个典型的大模型推理请求,需要消耗数百毫秒到数秒的 GPU 计算时间;当同时在线推理请求达到百万级时,所需的 GPU 数量是惊人的。头部 AI 云服务商(阿里云灵积、百度千帆、腾讯云)已经开始大规模扩充推理 GPU 集群,推理算力已经超越训练算力,成为 AI GPU 消耗量增长最快的应用场景。
AI 算力的"专业化分工"正在形成。训练和推理对硬件的需求特征是不同的:训练需要高内存带宽(HBM)和高精度浮点运算,对存储容量要求大但对时延要求相对宽松;推理需要低时延和高吞吐,对 FP8/INT8 等低精度推理能力要求更高,对内存容量的要求相对较低。这种差异,推动了 AI 芯片市场的进一步细分:华为推出专门针对推理场景的昇腾 310P,寒武纪推出针对推理优化的云端推理卡,市场上也开始出现"AI 推理加速卡"(侧重高吞吐低时延)和"AI 训练加速卡"(侧重内存带宽和浮点算力)的产品分类。这一趋势预计到二〇二七年将更加明显,AI 芯片市场的产品层次会比今天更加丰富和精细化。
数据中心基础设施的绿色化转型:不只是 PUE
讨论数据中心绿色化,大多数分析集中在 PUE(电能利用效率)指标上。但 PUE 只是数据中心绿色化的一个维度,完整的评估框架应该包括:能效比(PUE)、绿电比例(可再生能源占比)、碳排放强度(每单位算力的 CO₂ 排放量)、水资源消耗(WUE,Water Usage Effectiveness)、以及全生命周期碳足迹(包括建设阶段和设备制造阶段的碳排放)。
中国数据中心的绿色化转型,在二〇二五年呈现出若干值得关注的新进展:
绿色电力证书(绿证)与碳排放权交易挂钩。工业和信息化部、国家能源局推动的"绿电直供"机制,允许大型数据中心直接与可再生能源发电企业签订长期购电协议(PPA),以保障绿电供应。内蒙古和林格尔节点已有多个数据中心实现了超过八十%的绿电使用率,成为全国绿电比例最高的数据中心集群之一。随着全国碳市场将数据中心纳入控排范围的时间表日益明确,绿电采购的经济激励正在强化,高碳强度数据中心将面临更高的碳排放成本。
余热回收的商业化探索。数据中心排出的热量,过去几乎全部作为废热排放到大气中。余热回收(Waste Heat Recovery)技术,将服务器排出的热风或液冷系统中的热水,引导到城市供热系统、工业烘干流程或温室农业供热,实现能源的二次利用。在北欧,余热回收已经商业化运行多年——赫尔辛基市区有超过十分之一的供暖热量来自数据中心余热。在中国,成都天府超算中心在二〇二五年启动了与周边住宅小区的余热供暖试验,内蒙古和林格尔节点也在推进与农业温室的余热利用项目。这一方向的商业化将显著改善数据中心的"能源综合利用率",并为运营商带来额外的余热销售收入(虽然当前规模仍较小)。
AI 自动化运维降低运营能耗。传统数据中心的制冷系统是手动调节的,效率远非最优——制冷过度(为了保险而过度供冷)是数据中心能源浪费的常见来源。AI 辅助运维(AIOps)通过实时采集机房温度、气流、负载数据,用机器学习模型预测最优制冷参数,可以在不降低安全边际的前提下减少制冷系统的过量供冷。谷歌早在二〇一六年就开始在其数据中心运用 DeepMind 的 AI 模型控制冷却系统,实现了约四十%的制冷能耗降低。中国头部 IDC 运营商(润泽、万国)已开始引入类似的 AI 运维系统,一般可将 PUE 改善 0.05 至 0.15 的范围,对于大型数据中心,这意味着每年数百万度电的节省。
水资源效率正在成为新的约束指标。传统数据中心的制冷系统大量依赖蒸发冷却,消耗大量水资源——一个中型数据中心每天的耗水量相当于一个小型社区的用水量。WUE(Water Usage Effectiveness)指标衡量数据中心每消耗一度电的用水量,优秀水平应在 1.0 升/千瓦时以下。中国西北地区(新疆、内蒙古)已经明确将耗水量作为新建数据中心审批的参考指标之一,在干旱地区限制高耗水的蒸发冷却制冷方案,推动液冷和风冷方案的使用(这两种方案的 WUE 远低于蒸发冷却)。在极干旱地区建设数据中心,液冷技术的意义不只是节能,还直接关系到水资源可持续性和监管合规性。
工业互联网与数据中心的深度融合
过去五年,工业互联网与数据中心的关系,从"工厂数据采集后上云处理"的单向流动,正在演变为"工厂侧边缘计算节点 + 区域智算中心 + 国家级超算中心"的三层立体架构。
在工厂侧,随着工业设备数据量的爆炸性增长(一条汽车焊接生产线每天产生的图像、振动、温度传感器数据可达数百 GB),部分对时延敏感的 AI 分析任务(焊缝实时检测、设备振动异常告警)无法承受将数据传至远端云端再回来的往返时延(通常在几十到数百毫秒),必须在工厂内部或附近的边缘节点完成。这推动了微型数据中心和边缘算力节点在工业场景的快速渗透,工业边缘计算设备市场正在快速增长,拥有成熟边缘方案的厂商(华为、浪潮、紫光恒越)在工业互联网项目中的竞争优势日益突出。
在区域智算中心层,各省市建设的智算中心正在承接工业企业的"非实时 AI 任务"——如对生产线图像进行批量质检分析、对工艺参数历史数据进行大规模 AI 调优、对供应链数据进行 AI 预测分析。这类任务对时延要求相对宽松(分钟级到小时级),但数据量大、计算量大,适合在区域智算中心的 GPU 集群上批量处理。国家级战略明确要求,工业互联网与智算中心要实现协同建设,共享数据流通标准和安全合规框架。
这一"三层架构"的形成,对 IDC 行业的商业模式产生了深远影响:纯粹的"数据托管"(把服务器放在数据中心机房)已经不够,客户需要的是"从工厂传感器到 AI 洞察"的端到端解决方案,这要求 IDC 运营商具备边缘节点部署能力、工业数据采集与标准化能力,以及 AI 模型的行业化适配能力。在这一趋势下,具有行业 AI 能力的"云 + AI"融合型服务商(阿里云工业大脑、华为工业智能体)与传统 IDC 运营商(润泽、万国)之间的竞争边界,正在日趋模糊——前者向下延伸到基础设施运营,后者向上延伸到 AI 应用服务。这一竞争格局的演变,将是未来三至五年中国 IDC 行业格局变化的重要驱动力。
研究方法论说明
本报告在研究方法上坚持以下原则:
其一,数据多源交叉验证。市场规模估算综合参考国内 IDC 上市公司公开财务披露、工信部数字经济年度报告、国家互联网信息办公室数据安全年报、赛迪顾问与中国 IDC 圈的行业研究报告,以及 Synergy Research Group、IDC、Gartner 等国际机构对中国市场的估算数据,多源交叉印证后取中位估算,并明确标注数据置信区间。
其二,区分合并市场口径与子市场口径。"数据中心市场"在不同研究机构的定义差异极大:最宽泛的口径包含 IDC 运营、云计算基础设施、AI 服务器、芯片、基础设施制造全链条,可达数万亿元;最窄的口径仅统计第三方 IDC 托管服务收入,在一千亿至两千亿元之间。本报告明确使用"四层结构"(IDC 运营服务约一千五百亿、AI 算力服务约两千五百亿、AI 芯片约一千亿、基础设施制造合计约五千亿)的口径,并对各子市场的统计边界进行说明,以避免不同口径之间的混淆。
其三,明确标注不确定性较高的数据。中国数据中心行业的部分关键数据(如华为昇腾芯片出货量、国产 GPU 市场份额)并无官方公开口径,本报告基于多家机构的独立估算加以综合,并明确标注这类数据的估算性质和不确定区间,以供读者自行判断参考价值。研究院的核心立场是:宁可呈现一个诚实的不确定区间,也不以精确的数字掩盖数据本身的不确定性。
其四,聚焦产业链视角而非纯财务视角。本报告的首要关注点,不是哪家公司的股票是否值得买入,而是产业链各环节的结构性趋势:谁在哪个环节积累了护城河、哪些环节存在系统性脆弱点、哪些技术节点的突破将改变行业格局。财务数据是理解企业竞争力的入口,但结构性判断才是报告的核心产出。读者若需将本报告的研究发现用于投资决策,需结合自身风险偏好和对不确定性的判断,审慎独立评估。
其五,动态更新的局限性说明。数据中心与 AI 算力行业处于快速演化之中,本报告截止日期为二〇二六年六月。在报告成文之后,政策环境(如新一轮出口管制、绿电政策调整)、技术突破(如国产 GPU 新产品发布、液冷标准落地)和市场格局(如并购重组、重大合同签署)均可能发生改变,建议读者结合最新公开信息对本报告的关键判断进行动态校验。产业研究的价值,在于提供一套分析框架和当期基准,而非一份可以永久适用的静态结论。
最后,本报告在产业链数据的梳理上借助了覆盖中国在产制造业工厂的工厂数据库进行交叉核验——涵盖智算中心、液冷散热系统、服务器机柜等细分制造领域,用以校验文献数据与产业实际之间的一致性,是本报告区别于纯桌面研究的重要补充维度。通过对几十万家在产工厂的业务范围和能力进行系统性筛查,可以辅助判断某一供应链环节的国内生产主体密度、工艺分布和地域集中度,为定性分析提供产业链"分布热图"的量化参照。这一研究方法有其内在局限性(工厂数据库以外贸制造企业为主,不覆盖纯软件和云服务公司),读者在使用相关数据时需注意适用边界。本报告所引用的宏观数据均已注明原始来源,鼓励读者回溯一手数据来源进行独立核验,以形成自身对行业趋势和企业竞争力的独立判断。