摘要

2025年是中国乃至全球AI大模型发展史上真正意义的"跨越年":训练范式从参数竞赛转向推理效率,商业化路径从演示走向规模ARR,基础模型层从寡头并立演变为"中美双极+开源崛起"的三角格局。本报告以2026年6月为坐标,系统梳理中国AI大模型与应用全产业链——涵盖基础大模型、MaaS云服务、行业垂直模型、ToB/ToC应用、Agent智能体、AI设备与出海六大板块,结合FY2025全年财报数据、2026年Q1最新进展与二级市场表现,呈现一幅"看清结构、辨明趋势、摸准机遇"的产业全景图。

核心判断如下:

  • 中国AI大模型市场规模2025年约495—510亿元,含模型服务、ToB部署与ToC付费应用;含更广泛AI赋能软件的口径估算接近1000—1300亿元;2026年在Agent爆发与AI设备渗透加速双轮驱动下有望突破2000亿元。
  • DeepSeek的出现重写了全球成本曲线,其MoE架构将同等能力的训练成本压缩至传统方案的1/10,强迫竞争者全线降价并加速推理端侧化,是2025年全球大模型格局变化的决定性事件。
  • 中国基础模型第一梯队已形成:百度文心、阿里通义千问、字节豆包、腾讯混元四大互联网巨头,加上DeepSeek、智谱、月之暗面、MiniMax四支创业新势力;两梯队差距在2025年底显著收窄。
  • 应用层商业化迎来结构性拐点:2025年中国AI应用融资总额达1070亿元,但ARR普遍仍在百亿以下;MiniMax出海收入占比超70%、Kimi K2.5单月收入超2025全年是两个里程碑信号。
  • 算力国产替代进入实质性放量:2025年国产AI加速卡中国市场合计份额达41%,寒武纪上半年营收同比增长4347%,华为昇腾生态在大规模集群上已具备部分替代能力。
  • Agent与AI设备是2026—2028年最确定的增量:企业Agent渗透率从2025年的52%向2026年的80%目标冲刺;AI手机中国市场2026年出货量预计达1.47亿台,AI眼镜全球出货或突破3000万台。

一、定义、分类与产业链全景

1.1 从生成式AI到大模型:一套严谨的分类体系

"AI大模型"在中国语境中是一个泛称,覆盖参数规模通常在10亿(1B)以上、以Transformer架构为骨架、通过大规模预训练获得通用能力的深度学习模型。更严格地说,这一门类可按能力形态、部署模式和商业模式三个维度展开:

按能力形态,大模型分为语言大模型(LLM)、多模态大模型(涵盖文本+图像、文本+视频、文本+语音等)以及扩散模型(Diffusion Model,专用于图像/视频生成)。2025年的主流发展方向是原生多模态——即在预训练阶段就将图像、音频、视频token与文本token混合训练,代表作包括谷歌Gemini系列、Meta Llama 4与阿里通义千问Qwen3。

按部署模式,大模型分为API调用(MaaS,Model-as-a-Service)、私有化部署(企业购买算力自托管)与端侧推理(在手机、PC、眼镜等终端设备运行量化后的轻量模型)三种。2025年推理需求占算力消耗的比例已从2023年的36%升至约68%,并预计在2026年进一步升至73%,反映出行业从"训练炫技"向"推理变现"的重心迁移。

按商业模式,行业参与者可以划分为四个层级:

  • 基础模型层:自研超大参数预训练模型,以API或License变现,主要玩家包括OpenAI、Anthropic、Google DeepMind、百度、阿里、字节、腾讯、DeepSeek等。
  • MaaS/云服务层:提供模型调用、微调、私有化部署的云平台,包括阿里云百炼、百度智能云千帆、华为云ModelArts、腾讯云TI等;算力即服务(GPU服务器租赁)也并入此层。
  • 行业模型层:在通用基础模型上垂直微调,专攻某一行业场景,代表公司有商汤日日新(视觉/具身)、科大讯飞星火(语音/教育/政务)、百川智能(医疗)、第四范式(金融/工业)。
  • 应用层:面向最终用户的ToB/ToC产品,包括办公(金山WPS AI、飞书Copilot)、客服、营销、编程(Claude Code、GitHub Copilot、通义灵码)、内容创作(豆包创作、Kimi)、搜索(Perplexity)等。

1.2 产业链全景:从硅片到用户界面

AI大模型产业链可拆解为六个主要环节,每一环节都与制造业供应链存在深度交叉:

上游算力基础设施:GPU/AI加速芯片是核心生产资料,全球主导者为英伟达(NVDA),国产阵营以寒武纪(688256)、华为昇腾(非上市)、海光信息(688041)、沐曦MetaX等为代表。GPU服务器的制造商包括浪潮信息(000977)、中科曙光(603019)、宝德、鼎甲等。数据中心侧需要液冷服务器光模块与高速互联交换设备。

训练/推理算力服务智算中心运营商包括阿里云、腾讯云、华为云、百度智能云及大量地方政府主导的算力基地;AI服务器租赁和弹性推理服务是核心产品形态。

基础模型与预训练:消耗算力最密集的环节,参数从百亿到万亿级,训练一次大型模型耗资数千万至数亿美元。开源化(DeepSeek、Llama 4、Qwen3)正在持续压低准入门槛。

MaaS与开发平台:连接模型与应用的中间层,提供接口调用、向量数据库、检索增强工具链、智能体框架与参数微调服务,是面向企业开发者最密集的生态层。

垂直行业模型与AI应用:直接面向最终场景,变现形式包括软件即服务订阅、接口调用计费、硬件捆绑销售(智能眼镜/AI手机)、项目制实施与效果分成。

端侧AI设备:包括AI手机、AI个人计算机、AI眼镜、AI耳机等消费电子产品;需要加速卡级别的边缘芯片(苹果A18 Pro、高通骁龙、联发科天玑9400等),同时拉动散热设备存储设备等零部件需求。

1.3 与传统互联网/移动互联网的代际比较

理解AI大模型产业的商业逻辑,有必要与过去两次平台革命做一个横向比较。互联网时代(1995—2008年)的核心资源是带宽和流量,商业模式以广告和交易佣金为主,进入壁垒相对较低(网站可以低成本搭建);移动互联网时代(2008—2020年)的核心资源是移动操作系统和用户注意力,商业模式以超级应用(微信、支付宝、美团)的生态变现为主,进入壁垒由分发渠道和网络效应共同构筑。

AI大模型时代的核心资源是算力(训练和推理所需的芯片集群)、数据(高质量的预训练语料和指令微调数据)与模型能力(在各类测评基准上的领先性)。这三种资源的获取成本均以亿元计,远高于前两个时代的进入成本,这使得基础模型层天然走向高度集中——全球能够持续投入训练超大规模基础模型的玩家不超过二十家。但与此同时,开源化的浪潮使得"复制一个具备基础能力的模型"的门槛极低,形成了一个有趣的悖论:顶端极端集中,中长尾极端开放。

这一结构意味着,在产业链中游(行业模型、应用工具、企业私有化部署)和下游(最终用户场景),竞争格局远比基础模型层更为分散和动态,也存在更多中型企业获得超额回报的机会窗口。

进一步拆解这一结构的商业含义,可以对投资逻辑和战略决策提供更具体的指导:

对制造业企业的含义:制造业企业并不需要、也不可能成为"AI大模型公司",但需要成为"AI工具深度使用者"。采购决策应优先考虑:成熟的行业垂直AI解决方案(已有同行验证,风险低)、有完整私有化部署方案的供应商(数据安全)、以及有明确ROI计算模型的项目(排产优化、质检自动化、销售线索筛选)。在AI采购上"快速试点、快速验证、快速规模化"的执行速度,将成为制造业企业2026—2028年竞争力分化的关键变量之一。

对AI初创企业的含义:中游的行业模型层和下游的应用层虽然竞争激烈,但壁垒构建方式完全不同于基础模型层——基础模型层靠算力和数据规模取胜,而应用层靠场景深度、用户粘性和数据飞轮取胜。初创公司应当选择一个足够垂直的细分场景(比"法律AI"更细的"合同审查AI",比"工业AI"更细的"纺织品质检AI"),在这个细分场景中做到极致,积累无法被通用大模型轻易替代的专有数据资产,然后再向相邻场景扩展。

对政策制定者的含义:中游的MaaS平台和企业AI解决方案层,是政策扶持最能"精准滴灌"的层次——这里聚集了最多的中型科技企业,它们有技术能力但缺乏头部平台的资金规模,政府通过算力补贴、应用场景示范、数据开放共享,能够直接降低这一层企业的商业化门槛,进而加速整个AI产业的普及扩散速度。

1.4 大模型的技术演化路径:从GPT-1到超大规模多模态

大模型的技术谱系可以追溯至2018年谷歌发布的BERT(双向编码表示模型)和OpenAI发布的GPT(生成式预训练模型)。此后沿着两条主线并行演化:其一是规模扩张,GPT-1参数量1.17亿,GPT-2为15亿,GPT-3为1750亿,GPT-4据估计超过万亿(采用混合专家架构);其二是能力扩展,从单纯的文本生成到代码生成、图像理解、语音识别、视频生成的多模态融合。

2023—2025年是这一演化最密集的阶段。2023年初ChatGPT的现象级爆发推动中国互联网企业集体宣布大模型战略;2024年推理模型(以链式思维为核心的慢思考模式)异军突起;2025年DeepSeek-R1的低成本高性能证明了工程效率路线的可行性,同年阿里Qwen3开源、谷歌Gemini 3发布、Meta Llama 4推出原生多模态架构,标志着第四代大模型的全面成型。

这一技术演化的直接影响是:2025年的旗舰大模型在综合能力上已超越2024年初人类专家的评估预期,在数学竞赛、代码编写、科学推理等"难题"上的表现尤为突出,部分专业领域的局部能力已可与顶尖专业人士媲美。

二、全球格局与海外主要玩家

2.0 2025年全球AI大模型格局总览

在进入各主要玩家的深度分析之前,先建立2025年全球AI大模型格局的全景框架。以下是按技术能力、商业规模和生态影响力综合评估的全球前十大AI实体排名(截至2026年6月):

排名 公司/机构 主要模型 年化收入(估算) 核心差异化
1 OpenAI GPT-5/o系列 约250亿美元 最广泛的消费者渗透+企业API市场份额
2 Anthropic Claude 4.x系列 约470亿美元(2026年5月年化) 企业安全可靠性+Claude Code编程工具
3 Google DeepMind Gemini 3.5系列 难以单独拆分(云业务整合) 搜索生态协同+科学AI前沿研究
4 Meta Llama 4系列 间接变现(广告生态) 全球开源生态标准制定者
5 xAI Grok-3系列 约10—15亿美元 X平台实时数据+马斯克品牌效应
6 阿里巴巴 Qwen3系列 阿里云AI贡献约400亿元人民币 全球下载量第一的开源生态
7 DeepSeek V3/R1系列 约100—150亿元人民币 成本曲线颠覆者+技术开源影响力
8 字节跳动 豆包系列 火山引擎AI贡献约数百亿元 2.5亿月活ToC流量+推理算力规模
9 百度 文心5.0系列 智能云AI约200亿元 中国最早AI商业化者+飞桨生态
10 Microsoft Azure OpenAI/Copilot 难以单独拆分(Azure整合) 企业Office 365 Copilot渗透最广

这一格局呈现两个鲜明特征:第一,顶部位置被"商业化+研究投入"双重领先的公司占据(Anthropic的收入超过OpenAI的年化是2026年最出人意料的市场发展之一);第二,中国公司在排名前十中占据三席(阿里、DeepSeek、字节),相较于2023年的"零席位"是质的飞跃。

2.1 "中美双极+开源第三极"的新三元结构

2024年以前,全球大模型格局可以简单描述为"OpenAI领衔、谷歌追赶、中国跟随"。2025年这一格局被DeepSeek-R1的发布彻底打破,形成三极:美国封闭超大参数模型极(OpenAI/Anthropic/Google)、中国工程效率极(DeepSeek/阿里Qwen/字节豆包)、全球开源生态极(Meta Llama/DeepSeek/Qwen/Mistral)。三极并立的核心逻辑是:工程效率极证明了"同等能力可以用更低成本实现",倒逼封闭超大参数模型极在商业模式上被迫降价,同时全球开源生态极让开发者有了真实可用的替代选项。

三元结构的形成具有深远的产业意义。在此之前,OpenAI凭借GPT-4的代差优势构建起"闭源垄断"逻辑——最好的模型只能通过其API调用,付费才能获得最强能力。DeepSeek的出现瓦解了这一逻辑的根基:当开源模型的能力已经达到"实用等价",闭源模型的溢价空间急剧收窄。这一价格战的受益方是数以千万计的中小企业和个人开发者,他们以接近零边际成本的方式获得了原来需要支付数万美元API费用才能达到的AI能力。

从更宏观的视角看,三元格局背后是两套截然不同的技术哲学的碰撞:美国顶层玩家倾向于在超大规模算力投入上寻求绝对的能力突破(规模定律主义),而中国头部玩家则在算力受限的条件下寻求工程效率极致化(工程优化主义)。这两种哲学在2025年都取得了重大进展,但相互之间并没有胜负之分——它们共同定义了未来几年大模型技术演进的两条平行赛道。

2.2 OpenAI:GPT-5与年收入突破200亿美元

OpenAI于2025年8月7日正式发布GPT-5,这是一个融合"快速响应+深度推理"的统一系统,一周内推理工作负载增长8倍。截至2025年底,OpenAI年化收入突破200亿美元,月收入达到20亿美元;进入2026年后年化收入运行率升至约250亿美元,企业与商业收入占比超过40%。与此同时,OpenAI在企业AI支出中的市场份额从2023年的50%降至27%,Anthropic升至40%,谷歌占21%,三家合计88%,反映出市场已进入头部三强的白热化竞争阶段。

深入剖析OpenAI的商业模式,有几点至关重要的细节值得理解:

收入结构的双轨性:OpenAI的收入来源分为消费者订阅(ChatGPT Plus/Pro/Team,单价20—200美元/月)和企业API(按token调用量计费的B2B业务)两大主线。2025年企业API收入增速超过消费者订阅,反映出市场从个人试用向企业正式采购的迁移。ChatGPT作为消费者端的流量巨头(2026年月活接近7亿),充当了OpenAI品牌和API收入的免费获客渠道,是商业模式闭环的关键一环。

成本结构的挑战:OpenAI的高速增长背后是持续的亏损——2025年全年净亏损估计约50—70亿美元,主要来自超大规模算力投入(训练GPT-5等前沿模型的算力成本约数亿至数十亿美元)、Operator/Agent服务的推理成本,以及持续的研究人员薪酬。OpenAI的盈亏平衡点,依赖企业API客户的持续扩张和单位经济效益的改善。

非营利到营利的组织转型:2025年全年,OpenAI持续推进将原非营利母公司结构转变为营利型公司控制架构的复杂法律程序,以满足潜在IPO投资人的要求,并允许员工股票在市场上流动。这一转型在2026年初基本完成,为其估值冲击万亿美元(市场预测IPO后估值有望突破2000亿至5000亿美元)铺平道路。

2.3 Anthropic:Claude 4.x与估值冲刺万亿美元

Anthropic在2025—2026年经历了融资史上罕见的加速:2025年9月以1830亿美元估值完成130亿美元F轮,2026年2月以3800亿美元估值完成300亿美元G轮,2026年6月1日以9650亿美元估值秘密提交IPO申请并完成650亿美元H轮。收入端同样爆发:2025年底年化收入约90亿美元,2026年5月突破470亿美元年化收入。

在产品层面,Claude Code于2025年5月正式商用,到2025年11月年化收入达10亿美元,2026年2月升至25亿美元年化,成为编程工具赛道最快增长的商业产品之一。Claude系列模型持续迭代:Claude 4.5、Claude Sonnet 4.6(输入3美元/百万token,输出15美元/百万token)与Claude Opus 4.7相继发布,在推理、Computer Use与多模态能力上持续领先。

Anthropic的核心定位是"安全AI"的旗手,这一定位既是其商业战略,也是其企业文化的根基。创始团队来自OpenAI(由Dario Amodei和Daniela Amodei兄妹率队离开OpenAI后创立),核心关切是"如何确保日益强大的AI系统在人类所期望的方向上行动"。Constitutional AI方法(让模型学习一套价值原则并据此进行自我评估)和大量可解释性研究,是这一定位的技术支撑。

Anthropic在企业AI支出市场的市场份额从2023年的约10%跃升至2025年的40%,超越OpenAI成为企业客户采购的第一选择,背后有两个核心原因:第一,Claude的"长上下文+低幻觉率+高安全性"组合在企业关键业务场景(法律合同审查、财务报告分析、医疗记录处理)中的可靠性有口皆碑;第二,Claude的System Prompt功能允许企业定制化AI助手的行为边界(如"只回答与本公司产品相关的问题"),这一能力使Claude成为构建企业内部专属AI助手的首选基础模型。

对中国AI企业的启示在于:Anthropic的成功证明,在全球化竞争中,"安全+可靠+可控"的定位比"能力最强"的定位更能俘获企业付费客户的心——这一洞察对中国大模型公司的国际化战略设计有直接的参考价值。

2.4 Google DeepMind:Gemini 3.5与科学AI布局

Google DeepMind于2025年11月18日发布Gemini 3系列,随后推出Gemini 3.1 Pro Preview,并在2026年发布Gemini 3.5系列(以3.5 Flash起步),宣称"将前沿智能与行动力结合",侧重长程Agent任务。Gemini Deep Think在国际数学奥林匹克(IMO)级别问题上达到金牌水平,推理能力已达世界顶级科研场景适用水准。

谷歌的优势在于搜索与广告生态的协同:AI Mode(原SGE)将Gemini直接嵌入搜索结果页,日活用户数亿,变现链路最短;同时Google Cloud AI收入在2025年全年高速增长,GCP在企业AI支出中份额升至21%。开源侧,Gemma系列持续更新,为低成本端侧部署提供官方支持。

谷歌在AI领域面临的独特挑战是:作为互联网时代最成功的企业之一,其核心商业模式(搜索广告)正在被AI直接威胁。Perplexity、ChatGPT搜索、Gemini搜索模式的崛起,使用户可以直接从AI获取信息而无需点击广告链接,这在结构上损害了谷歌搜索广告的商业模式。谷歌必须在"用AI蚕食自己的搜索广告"和"不用AI则被竞争对手蚕食市场份额"之间艰难抉择。2025年谷歌选择了"拥抱AI Mode"的路线,将AI搜索作为搜索体验升级而非替代品,并探索在AI搜索结果中嵌入赞助内容的新广告格式。

谷歌的深层优势在于其无与伦比的数据资产:每天数十亿次的搜索查询、YouTube上每天数十亿次的视频观看记录、Gmail和Workspace中的大量用户行为数据——这些数据是训练下一代多模态AI的宝贵语料,而这种数据积累是任何竞争对手短期内都无法复制的。DeepMind的科学AI方向(AlphaFold 3在蛋白质结构预测、AlphaMath在数学定理证明、AlphaGeometry在几何推理上的突破)是谷歌将AI能力推向人类科学边界的长期投资,虽然商业化路径比应用层更长,但代表了AI能力扩展的最前沿。

2.5 Meta:Llama 4开源统治地位

Meta于2025年4月5日发布Llama 4,首次引入原生多模态+MoE架构:Scout(170亿激活参数/1090亿总参数,1000万token上下文)和Maverick(170亿激活参数/4000亿总参数)两款已开源;超大型Behemoth(2880亿激活参数/2万亿总参数)截至2026年6月仍在训练中。Llama 4在Hugging Face的下载量使中国开源模型超越美国的时间节点提前——2025年7月,通义千问主导的中国模型首次在月度下载量上超过美国。

Meta在AI领域的战略重心是"通过开源构建生态护城河":将Llama嵌入WhatsApp、Instagram、Messenger等月活超40亿的平台,以AI功能提升广告变现效率,同时通过开源吸引全球开发者为Meta AI生态贡献垂直微调模型。

Meta的开源AI战略有其独特的反直觉之处:表面上看,Meta将最强的模型开源是在"免费送竞争对手武器";深层逻辑是,Meta的主要收入来源是广告,而不是AI服务本身。通过开源Llama,Meta实现了三个商业目标:第一,确立了全球开源AI生态的标准制定者地位,吸引开发者在Llama基础上构建应用,进而在Meta的广告平台(Facebook、Instagram)上分发内容和触达用户;第二,通过向竞争对手提供免费的强大工具,加速整个AI应用生态的发展,间接扩大了AI驱动的数字广告市场规模;第三,通过开源赢得监管友好度——相较于OpenAI的"黑箱"闭源模型,Llama的开放性在欧盟AI Act的合规评审中享有天然优势,减少了与监管机构的摩擦成本。

2026年1月,Meta以超过20亿美元收购中国AI创业公司Manus(蝴蝶效应)的决定,是开源战略之外的另一个重要信号:Meta开始通过并购快速获取在Agent能力上领先的团队,将Manus的"多步骤任务自主执行"技术整合进Meta AI生态,与Llama的基础能力形成协同。这是2026年AI领域最重要的并购案之一,预示着Agent能力将成为主流AI平台的标配功能。

2.5.1 英伟达的算力护城河:硬件+软件的双重壁垒

英伟达在AI时代的竞争优势远超表面的"GPU制造商"标签,理解其护城河的深度对于预测AI产业长期格局至关重要:

硬件壁垒:先进制造工艺的护城河。英伟达最新的Blackwell/Rubin GPU采用台积电N4/N3工艺,依赖台积电数十年在极紫外光刻(EUV)、原子层沉积(ALD)等先进工艺上的积累。英伟达本身不拥有晶圆厂(Fabless模式),但与台积电形成了最优先的战略合作关系——在产能紧张时,英伟达能够以最高优先级获得台积电的先进工艺产能分配。这一关系本身就是竞争壁垒:其他GPU设计公司(AMD、英特尔)在与台积电的优先级博弈中处于相对劣势位置。

软件壁垒:CUDA生态的20年积累。CUDA(Compute Unified Device Architecture)是英伟达于2006年推出的GPU并行计算平台,迄今已有近20年的生态积累:全球超过400万活跃CUDA开发者,数百万个优化算子和预训练模型,以及建立在CUDA之上的完整工具链(cuDNN神经网络加速库、cuBLAS线性代数库、NCCL集合通信库)。任何试图替代英伟达GPU的方案,都必须提供"足够完整"的CUDA兼容层,而这需要投入数年的工程时间,且目标会随英伟达的持续更新而不断移动。这是华为昇腾和寒武纪面临的最核心的非硬件挑战。

生态壁垒:从芯片到系统的纵向整合。英伟达通过NVIDIA DGX系统(将多块GPU、高速互联、内存整合为一体的AI训练服务器)、NVIDIA Networking(InfiniBand高带宽互联网络,通过收购Mellanox获得)和NVIDIA NIM(推理微服务)实现了"芯片→系统→软件服务"的纵向整合。这意味着客户购买英伟达GPU后,可以获得一整套开箱即用的AI训练和推理解决方案,而非仅仅是一块芯片。这种一体化体验大大降低了大型企业部署AI集群的工程门槛,也加深了客户对英伟达生态的依赖程度。

2.6 xAI与Mistral:新锐力量

xAI于2025年2月发布Grok-3,主打增强推理能力,借助X(Twitter)平台的海量实时数据构建差异化。2026年1月xAI完成200亿美元E轮融资,估值2300亿美元;随后与SpaceX合并后整体估值约1.25万亿美元。Grok MAU在2026年3月达到1.17亿,美国聊天机器人市场份额升至17.8%,成为ChatGPT、Gemini之后的第三大平台。

法国Mistral AI以小而精的开源模型策略赢得欧洲企业开发者认可,估值在2025年跻身60亿美元级别;在欧盟AI Act落地的背景下,本土AI供应商的合规优势愈发凸显。

xAI的竞争优势和战略价值建立在一个独特的资产上:X(前Twitter)平台每天产生的数以亿计的实时帖子,是训练具有"最新知识"大模型的稀缺资源。传统大模型有"知识截止日期"的限制,而Grok依托X平台的实时数据流,可以在发布后几分钟内处理关于刚刚发生的新闻事件的查询,这在突发新闻理解和实时市场动态分析上具有其他AI无法复制的优势。

Mistral的战略位置同样独特:作为欧洲唯一进入全球前十的大模型公司,Mistral承载了欧洲的"AI自主战略"政治需求——法国政府和欧盟委员会都有强烈意愿扶持本土AI冠军企业,以减少对美国科技公司的战略依赖。2025年Mistral获得欧盟数字主权基金的直接注资,并在多项欧洲政府采购项目中获得优先采购地位。在商业模式上,Mistral采用开源+企业服务的混合模式(类似Red Hat之于Linux),通过在Mixtral开源版本之上提供企业级SLA、私有化部署支持和定制微调服务获取商业收入。

2.7 英伟达:Blackwell引爆算力超级周期

2.7 英伟达:Blackwell引爆算力超级周期

英伟达FY2025(截至2025年1月)全年营收1305亿美元,同比增长114%,Blackwell系列GPU是最核心驱动。2025年Q2单季营收467亿美元(同比+56%),Q3升至570亿美元,Q4达681亿美元(同比+73%);2026年Q1指引780亿美元,全年Blackwell+Rubin合计营收能见度约5000亿美元。

Blackwell的核心技术突破在于:HBM3e内存带宽大幅提升、NVLink带宽倍增以支持万卡规模集群互联、以及FP4精度推理使单卡推理吞吐量相较H100提升约4倍。英伟达还通过CUDA生态、Omniverse与NIM(NVIDIA Inference Microservices)构建了硬件之外的软件护城河,使其在可预见的未来仍是AI训练的首选算力平台。

英伟达在中国市场的处境极为特殊:一方面,中国是其最大的单一国家市场之一(制裁前占总营收约17%),禁止出口H100/A100后这一份额大幅下降;另一方面,H20作为专门为中国市场"减配"的合规出口芯片(峰值算力约为H100的22%,但通信带宽未被限制),在2025年4—7月短暂断供又恢复供应的过程中,充分暴露了中国AI企业对英伟达GPU的深度依赖。

英伟达的中国战略面临一个根本矛盾:完全退出中国市场会损失重大收入(也会给国产GPU竞争对手送去空间),但在美国对华技术出口管制持续收紧的背景下,任何旨在扩大对华供应的举动都面临美国政府的政治压力。黄仁勋的态度是"在合规范围内尽量维持对华业务",这体现在他多次公开场合主动到中国会见政府官员和企业客户,以及推动H20许可证的快速恢复。这一微妙的地缘博弈,将在未来数年持续影响中国AI算力的供应格局。

对中国AI产业而言,英伟达的这一两难困境反而是国产GPU突破的重要历史窗口——每次英伟达供应中断或管制收紧,都会推动中国AI厂商加快国产化验证,积累在真实生产工作负载下的国产GPU稳定性数据和优化经验,为未来更大规模的国产化替代奠定基础。

三、PEST分析:宏观环境与监管框架

3.1 政治与监管:备案制+安全标准双轨并行

中国已构建起全球最完整的生成式AI专项监管体系。《生成式人工智能服务管理暂行办法》自2023年8月15日施行,确立了"备案准入+安全评估+内容审核"三位一体的监管框架。截至2025年12月31日,全国已有748款生成式AI服务完成备案、435款AI应用或功能完成登记,其中北京以144款居首(占33%)。

2025年4月,《生成式人工智能服务安全基本要求》正式升格为国家强制标准,从模型安全测试、数据标注规范、用户协议披露等维度作出具体量化要求。2025年12月,网信办就《人工智能拟人化互动服务管理暂行办法》公开征求意见,意图规范类人AI助手的身份披露和情感依赖边界,预计2026年上半年正式施行。

美国制裁与出口管制是另一重大政治变量。2025年4月,特朗普政府突然暂停英伟达H20向中国出口,英伟达为此计提约55亿美元损失;但2025年7月15日,英伟达CEO黄仁勋宣布美国政府批准出口许可证,H20重新开放对华销售。2025年3月,美国商务部将50余家中国AI及超算企业列入实体清单,对华算力封锁仍在持续推进。欧盟AI Act已于2025年正式落地,高风险AI应用受到严格规制,对出海欧洲的中国AI产品构成合规挑战。

中国监管体系的深层逻辑

理解中国AI监管,不能仅将其视为"政府管制",而要看清其背后的政策工具属性:

备案制度实质上是一套准入许可机制,但与欧盟AI Act的"基于风险分级"路径不同,中国采取的是"基于服务类型强制备案+内容安全前置审查"的路线。这一路线的设计逻辑是:AI服务面向公众提供前必须通过安全评估,把可能的社会危害在进入市场前就过滤掉;相比在上市后再进行监管纠正,这种前置门控的合规成本更高,但监管效果更可预期,也更符合中国政府"宁可少一点也要稳一点"的监管哲学。

对企业的实际影响是双向的:对大型企业有利(合规资源充裕、技术团队能够通过评估、且备案形成了对非正规小模型的准入壁垒),对初创企业构成相对较高的合规门槛。2025年已有部分早期创业公司因无法通过安全评估而被迫推迟产品上线,或选择以ToB私有化部署形式绕开面向公众服务的备案要求。

国产替代政策的产业塑造效应

政府采购的AI国产替代政策是塑造市场格局的另一关键政治力量。2025年各级政府机构在AI软件采购中的国产化率要求已从70%提升至80%—90%,明确排除境外AI大模型服务。这一政策直接决定了科大讯飞、百度、华为AI在政府市场几乎没有境外竞争对手,形成了独特的"政务AI国内寡头格局",与更加竞争激烈的商业AI市场形成鲜明对比。

"人工智能+"国家战略在2025年的推进力度进一步加大:国家层面明确将AI定为新质生产力的核心驱动力,各省市纷纷出台AI产业扶持政策(算力补贴、企业研发抵税、应用场景示范点认定),大量资金涌入地方AI产业园区建设,形成了一股"AI基础设施大跃进"的地方政策浪潮。这一浪潮为AI服务器智算中心建设提供了直接的财政支撑,但也引发了部分经济学家对"重复建设"和"低利用率算力空转"的担忧。

3.2 经济:算力成本下降与商业化加速共振

训练成本的指数级下降是2025年最显著的经济信号:DeepSeek-V3的训练成本据报道约560万美元,仅为同等能力GPT-4级模型的约1/20。这一成本曲线变化直接带动了两个经济效应:其一,接口调用价格进入"分钱时代",DeepSeek的定价仅为OpenAI的1/10,带动全行业主动降价;其二,大量此前因算力成本望而却步的中小企业开始尝试AI部署,企业级市场的潜在规模被显著放大。

中国政府在算力侧的投入同步放大:2025年"人工智能+"行动计划推动各省算力基地建设,地方政府主导的智算中心数量超过200个,与商业云厂商并行形成双轨算力供给。中国移动2026年初一次性采购7499台推理型AI服务器,订单超50亿元,是推理算力投资规模化的代表性事件。

从投融资结构看,2025年全年中国AI大模型及应用领域融资总额突破1000亿元人民币,其中基础大模型(月之暗面、MiniMax、智谱、阶跃星辰)约占30%,应用层(工业AI、医疗AI、法律AI、编程工具)约占45%,算力基础设施约占25%。与2023年"广撒网、押大模型"的融资风格不同,2025年的资本正在向有明确商业化路径的企业集中,沉淀期越来越明显。

在宏观经济层面,中国经济增速放缓使企业对降本增效的需求更为迫切,这意味着AI工具(尤其是能直接降低人力成本的客服机器人、代码辅助、文档处理)的企业采购意愿高于预期。2025年规模以上工业企业中,已引入至少一种AI辅助工具的比例估计超过35%,较2024年的约18%有显著提升——这说明AI在制造业的渗透速度正在加快,而非停留在"试点阶段"。

3.3 社会:ToC应用从"尝鲜"到"依赖"

豆包月活2.5亿(字节三款AI应用合计)、腾讯元宝月活突破1亿、Kimi重整后的K2.5在20天内收入超2025全年——这些数据共同指向一个结构性变化:中国面向消费者的用户已从好奇驱动的"尝鲜期"进入需求驱动的"依赖期",会员订阅和接口付费逐步成为用户的常规支出项目。

教育场景是变现最快的消费端垂类:科大讯飞AI学习机收入在2025年翻倍,搭载大模型的AI辅导产品形成了高粘性的家长付费习惯。编程工具是全球最快商业化的场景:智能编程工具(包括多家国内外产品)共同推动"AI编程助手"成为软件开发者的标配工具,付费渗透率在2025年估计超过20%。

从用户结构变化看,2025年中国AI工具的付费用户群体呈现两个值得关注的特征:第一,学历越高、收入越高、城市级别越高的用户付费率越高,这与移动互联网时代"下沉市场带动增长"的逻辑正好相反,说明AI工具的价值感知目前仍主要集中于知识型工作者群体;第二,25—40岁程序员、产品经理、内容创作者是当前AI付费用户的核心人群,平均月消费约100—300元人民币,远高于视频会员等娱乐类订阅。

社会层面的另一重要变化是对AI生成内容接受度的快速提升。2023—2024年,大众对"AI写的文章""AI作的画"仍有明显的心理排斥;2025年以后,随着AI内容质量的提升,消费者开始以结果导向判断内容价值,而非追究生成工具。这一心态转变为AI内容生产工具(AI写作助手、AI配音、AI图像)的商业化打开了更大的空间。

3.3.1 人才流动与"AI人才溢出效应"

AI大模型对中国就业市场的影响已经在2025年超越理论讨论,进入真实可量化的阶段。这一影响在两个方向上同时发生:创造新岗位(AI工程师、提示词工程师、AI产品经理、AI安全研究员)的同时,也在替代传统岗位(呼叫中心坐席、基础数据标注、简单内容写作、重复性代码工作)。

AI人才溢出效应:从学术界和大厂流出的顶级AI研究人员正在加速创业,形成"1个清华AI博士→1家AI创业公司→带动5—10个本科毕业生"的人才聚集效应。2025年北京、上海的AI创业公司(员工50人以上)数量超过500家,其中约70%的技术核心团队有清北计算机/清华AI研究所/百度/字节等一线机构的背景。

AI替代效应的结构性分化:并非所有职位都面临同等的AI替代风险。国内研究机构对"AI替代风险"的岗位分类大致如下:高风险岗位(10年内替代概率>70%)包括电话营销、初级会计、基础数据录入、简单图片处理、标准合同审查;中等风险岗位(30%—70%)包括初级法律助理、新闻写作、初级程序员、客服主管;低风险岗位(<30%)包括创意导演、复杂工程决策、高级管理岗位、医护人员、教师(个性化辅导)。

从整体看,AI对中国就业的净影响在2025年仍为"结构性正面"(新创AI岗位绝对数量超过被替代岗位的净流失),但这一判断在2027—2028年Agent能力大幅提升后可能发生反转,届时自动化浪潮将从白领知识工作者蔓延至需要手眼协调的蓝领工作(由具身AI机器人驱动)。

人才价格与招募竞争:2025年国内顶级AI算法工程师(有顶级实验室背景+2年以上大模型训练经验)的年薪中位数约100—300万元人民币,部分顶尖候选人(有DeepSeek/Anthropic/OpenAI经历)的谈判价可达500—1000万元/年。这一薪资水平与硅谷顶级AI公司的人民币等值水平相当,意味着中国AI人才市场的竞争激烈度已接近全球最高水平,人力成本正在成为AI创业公司的主要固定支出之一。

3.4 技术:MoE+推理+多模态三大范式重构

2025年的技术主线可以用三个关键词概括:混合专家架构(每次前向传播只激活部分专家子网络,将模型总参数量大幅提升的同时控制实际计算量,DeepSeek V3以6850亿总参数、370亿激活参数为代表)、推理模型(通过强化学习让模型在生成答案前进行显式"思考",在数学、代码、科学推理等任务上性能大幅超越前代)、端侧量化(将7B—70B参数的模型压缩至可在手机神经网络处理单元或笔记本电脑运行,推动推理成本持续下降)。

这三大范式的协同效应是:模型变得"又大又省"——总参数量达到万亿级别带来的广博知识面,加上激活参数精简带来的推理效率,加上端侧量化带来的无处不在的部署能力。这使得2025年的旗舰大模型在能力上比2024年提升约40—60%(主流评测基准),而推理成本反而因效率改进下降约30—50%,呈现出"性价比双向改善"的罕见特征。

值得特别关注的是,三大技术范式的协同进化已经催生出一类此前没有出现过的能力形态——长视野多步推理(Long-Horizon Multi-Step Reasoning)。这指的是模型在面对需要数十步骤、数小时实际执行时间的复杂任务(如完整的软件项目开发、跨多个数据库的科学研究、需要调用十余个专业工具的商业分析)时,能够自主规划步骤、执行动作、检测错误并调整方向,而不需要人类在每一步介入指导。这一能力正是Agent技术的核心前提,也是为什么2025年全球AI行业集体从"大模型"话题转向"Agent"话题的技术根源。

从技术演化路径预测来看,2026—2028年最重要的前沿方向有以下几个:其一,Test-Time Compute的可控化——当前推理模型的"思考"过程对用户而言是黑箱,如何让用户可以控制"思考"的深度和方向(为快速回答节省成本,为复杂问题投入更多计算)是下一个工程重点;其二,World Model的实体化——视频生成模型(如OpenAI Sora、谷歌Veo、快手可灵)正在从"生成美丽视频"向"模拟物理世界"演化,一旦能够准确模拟物理规律,将成为机器人训练、自动驾驶仿真、工业设计验证的通用基础;其三,持久记忆架构——当前大模型的记忆局限在一次对话的Context Window内(最长约百万token),如何构建跨会话的持久记忆,是AI助手从"工具"进化为"伴侣"的关键技术鸿沟。

四、中国市场规模:分层拆解与竞争集中度

4.1 测量大模型市场的三大挑战

在正式进入数据分析之前,有必要厘清准确测量AI大模型市场规模面临的三大方法论挑战,否则不同来源的数字会让读者无所适从。

挑战一:边界模糊。AI大模型既是独立产品(可以直接订阅文心一言、Kimi等),又是其他软件产品的内嵌功能(WPS AI月活中有多少是真正为AI付费的用户?金山办公的营收里有多少来自AI溢价?这些数字很难精确剥离)。不同研究机构对边界的划定方式差异极大,导致同一年份的"中国AI大模型市场规模"可以从几十亿到几千亿不等。

挑战二:免费流量的估值。豆包、元宝、文心一言均在2025年实施过不同程度的免费策略,大量用户以零成本使用大模型能力,其实际消耗的算力和模型推理资源是有成本的,但在市场规模统计中无法被货币化统计。若将这部分"按成本估值"的免费流量纳入,市场规模将显著高于付费口径。

挑战三:产业带动效应的归因。一家制造企业引入AI质检系统节省了500万元人工成本,这500万元的"AI带动价值"是否算入AI市场规模?答案取决于研究者的统计口径,宽口径和窄口径之间相差可达3—5倍。

理解这三大挑战后,再看下面三种口径的数字,才能做出合理解读。

4.1 市场规模:三种口径的比较

中国AI大模型相关市场的规模估算因口径不同差异悬殊,理解三种口径是读懂行业规模的前提:

口径一(窄口径):纯模型服务MaaS,包括API调用收入与模型授权费,2025年估计约80—100亿元。这一口径与ToB/ToC应用收入无关,仅反映"模型本身"的直接货币化,当前仍处于起步阶段。

口径二(中口径):大模型直接相关收入,包括MaaS+AI应用SaaS订阅+AI设备AI功能溢价,2025年估计约495—510亿元,与36氪研究院及中商产业研究院的预测基本吻合,2026年预计突破700亿元。

口径三(宽口径):AI赋能型产业收入,将AI带来的增量收入(云计算AI相关增量+制造业AI降本增效+金融AI投顾+医疗AI等)全部纳入,2025年口径接近1000—1300亿元,2026年有望突破2000亿元。

本报告主体使用中口径约500亿元的基准,同时在具体子赛道分析中引用宽口径数据。

4.2 子赛道拆解

子赛道 2025年规模估算 2026年预期 代表玩家
基础模型MaaS 80—100亿元 180—200亿元 百度千帆/阿里百炼/字节火山/腾讯TI
ToB行业解决方案 150—200亿元 300—400亿元 商汤/科大讯飞/第四范式/智谱
ToC AI应用订阅 80—120亿元 200—300亿元 豆包/Kimi/MiniMax海螺/元宝
AI办公/编程工具 50—80亿元 120—180亿元 WPS AI/通义灵码/Claude Code
AI设备AI溢价 50—80亿元 150—250亿元 科大讯飞AI学习机/小米AI手机/AI眼镜
Agent企业部署 30—50亿元(起步) 100—150亿元 Manus/百度ERNIE Agent/字节扣子

对以上子赛道的市场规模预测,有几点方法论说明需要补充,以便读者理解数字背后的假设条件:

基础模型MaaS的增长驱动:80—100亿元的2025年基准数字反映的是DeepSeek、阿里百炼、百度千帆等主要平台的API收费收入。2026年有望翻倍至180—200亿元,核心驱动是Agent应用的爆发——Agent执行多步骤任务需要大量token调用,单个Agent工作流的月均API消耗可达普通用户的50—100倍。

ToB行业解决方案的增长天花板:150—200亿元估算中,科大讯飞(约60亿)、第四范式(约35亿港元)、商汤(生成式AI业务约30亿)合计已接近主要上市公司的实际披露数字;其余约50亿来自中小AI公司和定制项目。这一赛道的增速预计在2026年约60—80%,主要增量来自政府数字化和制造业AI改造。

ToC订阅的结构性瓶颈:中国ToC AI订阅面临三个结构性瓶颈——用户对软件订阅的整体付费习惯仍弱于欧美市场(月均付费意愿约20—50元,远低于西方用户的100—200元等值);免费高质量大模型(DeepSeek开源版、豆包基础版)持续压制付费动机;微信生态的封闭性使AI应用难以在超级App外建立独立的用户支付关系。这三点共同决定了ToC AI订阅在中国的增速将低于全球均值,但绝对规模仍将持续增长。

Agent赛道的爆发性潜力:Agent企业部署目前仅30—50亿元规模,但这是整个大模型产业链中成长确定性和弹性最大的赛道。谷歌云ROI of AI 2025报告指出,Agent应用的平均投资回报率为4.3倍,显著高于普通AI工具的1.8倍,意味着企业对Agent的付费意愿更强、采购预算更高。预计2028年Agent企业部署规模将突破1000亿元,是当前规模的20—30倍。

4.3 竞争格局:CR10与市场集中度

基础模型层高度集中,互联网四大(百度、阿里、字节、腾讯)合计市场份额按MaaS调用量估算约占65%—70%;加上DeepSeek(占约10%)和智谱/月之暗面/MiniMax三家(合计约10%),CR10约85%—90%。值得注意的是,DeepSeek作为非公开服务的开源模型,通过第三方平台的调用量已接近头部互联网厂商。

应用层竞争格局更为分散:AI办公赛道金山WPS AI一家独大(AI月活2951万),AI搜索以秘塔AI/Kimi/豆包为主要玩家,AI内容生成工具呈现百花竞放态势。Agent赛道2025年进入商业化元年,头部集中度尚未形成,预计2026—2027年将经历一轮大规模整合。

竞争格局分析的纵深维度:从"一维竞争"到"多维博弈"

简单的市场份额分析无法捕捉中国AI大模型市场竞争格局的真实复杂性。2025年的竞争已经从"谁的模型能力最强"(一维竞争)演变为至少五个维度的多维博弈:

维度一:模型能力(Technology Race)。在MMLU、HumanEval、中文评测等标准基准上的排名仍然重要,但已不再是竞争的唯一决定因素。更关键的是在用户真实任务(Chatbot Arena人类盲测)中的表现,以及在特定垂直场景(代码生成/医疗/法律)上的专项能力。

维度二:生态系统粘性(Ecosystem Lock-in)。谁的开发者生态最完整、谁的平台集成了最多的第三方工具、谁的API与用户自身的技术栈兼容性最高,在"足够好"的模型能力成为普遍条件后,生态粘性成为最核心的竞争壁垒。阿里云百炼凭借200+模型的广度和与阿里巴巴电商生态的深度集成,在生态维度具有显著优势。

维度三:商业化速度(Go-to-Market)。能够快速将模型能力转化为企业客户的签约ARR,取决于销售团队的执行力、针对特定行业的定制化方案能力、以及成功客户案例的积累速度。科大讯飞在政务和教育赛道的商业化执行是国内最成熟的参考样本;第四范式在金融领域的销售体系建设已经历多年打磨。

维度四:数据飞轮(Data Flywheel)。拥有最多真实用户(豆包1亿月活、ChatGPT约7亿月活)意味着每天都在生成大量用于强化学习的用户偏好信号,形成"用户越多→模型越好→用户越多"的正向循环。这一飞轮效应在初期很难察觉,但一旦规模化后将形成极难追赶的隐形护城河。

维度五:算力自主性(Compute Independence)。能否在中美算力对抗升级的背景下确保训练集群的稳定供给,直接影响模型迭代速度。阿里、腾讯、百度均已显著增加国产芯片采购比例;DeepSeek凭借其工程效率优势,在相同算力约束下实现了远超预期的模型性能,证明"算力约束可以通过架构创新部分克服"。

五、产业链深度拆解

5.1 算力基础设施(与数据中心AI算力专题报告联动)

AI大模型的运转依赖两类算力:训练算力(一次性、高并发、需要万卡以上互联)与推理算力(持续性、低延迟、对单卡效率要求高)。2025年推理算力占比升至约68%,这一趋势推动AI服务器配置从"训练优先"转向"推理优先",体现在H100占比下降、L40S与RTX 4090类推理卡占比上升,以及端侧NPU算力的快速放量。

算力基础设施层的产业链结构,在AI需求爆发后发生了几个关键变化:

变化一:超大规模集群的主流化。2022年,1000张GPU的训练集群已属于顶级规模;2025年,头部AI实验室的标准训练集群达到10万张GPU以上,英伟达的大客户(微软、谷歌、字节、阿里)均在部署超大规模集群。超大规模集群带来了新的工程挑战:当集群规模扩大10倍,节点间的集合通信(All-Reduce)带宽需求按平方级增长,网络交换机光模块的带宽规格持续升级(从100G、400G到800G、1.6T),推动整个光互联产业链的技术迭代和产能扩张。

变化二:AI数据中心的PUE优化成为核心。传统商业数据中心的PUE(Power Usage Effectiveness,总用电量/IT设备用电量)约为1.3—1.5;新建AI数据中心要求PUE不超过1.25,部分采用液冷的超级算力中心已实现PUE接近1.1。PUE的改善直接降低运营成本(以10万张GPU的算力中心为例,PUE从1.4降至1.2,年度电费节省约1亿元人民币),也满足了监管对绿色算力的要求。数据中心制冷数据中心节能技术因此成为AI基础设施投资中确定性最高的细分赛道。

变化三:推理基础设施的专业化分化。AI推理需求的特点(高并发、短时延、Cost-Per-Token优先)使推理集群的硬件配置与训练集群显著不同——更重视单卡内存容量(KV Cache存储)、更高密度部署(减少网络跳数)、以及更灵活的弹性扩缩容(应对峰谷流量差异)。国内阿里云、腾讯云开始针对推理场景部署专用的"推理节点"(而非将训练节点闲置时用于推理),这一专业化趋势推动了机架服务器市场向AI推理优化方向的细分。

GPU服务器整机制造仍以浪潮信息(000977)、中科曙光(603019)和宝德计算为主;但随着国产GPU放量,搭载华为昇腾910B和寒武纪MLU370的AI服务器在政府与央企采购中占比迅速提升,2025年合计市占率超过30%。液冷服务器在功耗密度超过40kW/机柜的超大规模数据中心中已成标配,推动液冷设备冷板液冷供应商迎来快速增长。

互联层面,400G—800G光模块是AI算力集群的血管,中际旭创、天孚通信、华工科技等A股企业在这一环节具有全球竞争力。数据中心机柜精密空调UPS电源配电柜共同构成数据中心的物理基础设施,国内供应商竞争格局相对成熟。

5.1.2 算力供需结构的历史性转变:从训练到推理

2025年算力市场最重要的结构性变化,是需求重心从训练端大幅迁移至推理端。在2022—2023年的大模型训练热潮中,数据中心的采购重心是8卡训练服务器(H100/A100满配),追求极致的并行计算吞吐;进入2025年,随着主流模型进入成熟部署阶段,推理侧的需求快速扩张,训练与推理的算力消耗比从2023年的约64/36变化为2025年的约32/68,并预计2026年进一步演变为27/73。

这一结构变化对整个算力供应链产生了深远影响。在AI服务器形态上,推理优化的服务器更重视单卡内存容量(支持更大的键值缓存)、低延迟互联(支持毫秒级响应)和高密度部署(更多并发用户);而训练优化的服务器更重视峰值浮点运算能力和高带宽内存。这意味着市场对液冷服务器AI服务器的具体配置需求发生了结构性调整。

对国内芯片厂商而言,推理侧的技术要求相对低于训练侧——华为昇腾910B的推理性能已与英伟达H20基本持平甚至略有优势(部分工作负载下),这为国产算力在商业化推理场景中的突破提供了历史性窗口。2025年中国主要云厂商在扩建推理集群时,国产芯片的采购比例明显高于训练集群,这一趋势有望在2026年进一步强化。

此外,推理算力的"长尾化"也值得关注:不仅大型云数据中心是推理需求的承载节点,边缘侧的AI服务器(部署在运营商机房、工厂车间、医院机房等靠近业务场景的节点)、以及最终用户设备的端侧芯片,都在2025年快速增长,形成"云-边-端"三层推理算力体系。

5.2 基础模型层:开源与闭源的博弈

2025年基础模型层最重要的结构性变化是:开源大模型的能力与闭源拉近至"实用等价"区间。DeepSeek-V3在多项基准测试上媲美Claude Opus/GPT-4.5,而其MIT开源许可证使任何机构都可以零成本获取;阿里通义千问Qwen3开源了从0.6B到235B的全尺寸系列,全球下载量超3亿次,衍生模型数超10万个,正式超过Llama成为全球开源模型第一生态。

闭源方向上,2025年底文心大模型日均调用量超16.5亿次(从2023年同期5000万次增长33倍),文心5.0 Preview在国际评测榜上进入全球第二梯队;百度宣布2026年6月30日起开源文心大模型4.5系列,进一步加剧开源生态竞争。

5.2.1 开源模型的七大核心优势与三大内在局限

开源大模型在2025年的快速崛起并非偶然,其背后是七个方向上的结构性优势共同作用的结果:

成本自由:零授权费+自选算力,中小企业完全摆脱了对特定云厂商或模型厂商的绑定,议价能力大幅提升。

数据主权:私有化部署意味着企业的核心业务数据不需要离开自身的安全边界,对于金融、医疗、政务等数据敏感行业而言,这是采用开源模型的根本动因。

定制灵活:可以在原始模型基础上针对特定场景、特定语言、特定领域数据进行全量微调或参数高效微调,实现高度个性化的能力适配。

社区迭代:开源生态汇聚全球研究者的贡献,新的优化技术(推理加速、内存压缩、量化算法)往往首先在开源社区出现,然后才被商业模型采纳。

竞争基准:开源模型的存在使市场对闭源模型的定价产生自然约束——当DeepSeek V3免费可用,OpenAI被迫为其服务提供合理的溢价理由。

本地推理:量化后的开源模型可以部署在消费级GPU甚至CPU上,实现零延迟、无网络依赖的本地推理,这是闭源API服务无法提供的能力。

出海友好:国际市场对中国开源模型(Qwen3、DeepSeek)的接受度远高于闭源商用模型,开源许可证消除了潜在的数据泄露担忧,降低了国际企业采用中国AI技术的心理门槛。

当然,开源模型也存在三大内在局限:其一,部署和运维需要相当的技术能力,中小企业往往需要依托云厂商的托管服务;其二,最顶尖的推理能力(尤其是超大规模的慢思考模型)目前仍主要在闭源模型中;其三,开源生态的碎片化导致兼容性问题层出不穷,企业在选型时面临较高的沉没成本。

从更长时间维度审视,开源与闭源的竞争格局实际上反映了AI产业链的价值分配博弈:如果开源大模型持续追平闭源顶尖模型的能力,大量价值将从基础模型层向上层的应用场景和数据积累层迁移;如果闭源模型始终维持显著的能力领先优势(无论是因为训练数据、安全对齐还是架构创新),则价值将在基础模型层持续沉淀。目前的趋势更倾向于前者——最强能力的闭源溢价窗口正在从"数年"压缩到"数月",这是整个产业链价值重心向应用层移动的根本原因。

5.3 MaaS与开发平台:从工具到生态

MaaS平台的竞争逐渐从"谁的模型能力最强"转向"谁的开发者生态最完整"。阿里云百炼平台提供200余个预置模型,覆盖文本、图像、语音、视频全模态;百度智能云千帆平台的大模型客户数在2025年超过8万家,同比增速超150%;华为云ModelArts支持昇腾全量算力接入,在政务和金融私有化部署中具有独特优势。

RAG(检索增强生成)技术企业采用率在2025年达到75%,成为ToB部署的标配组件,推动向量数据库(Milvus、Chroma等)和知识管理中间件市场快速成长。LoRA/QLoRA微调工具的成熟使中小企业可以用单卡在数小时内完成行业模型调优,大幅降低了AI应用定制化的技术门槛。

5.3.1 模型即服务平台的差异化竞争维度

2025年国内主要云厂商的模型即服务平台已进入白热化竞争,差异化重心从模型能力转移到以下五个维度:

模型丰富度:阿里云百炼提供200余个预置模型,覆盖文本、图像、语音、视频全模态,用户可以在同一平台上切换不同提供商的模型,进行成本与性能的横向比较。这对企业开发者的吸引力在于"一站式采购",避免了跨平台集成的开发成本。

微调工具链完整性:从数据清洗、指令微调、对齐训练到模型评估的全链路工具链,是企业客户最核心的需求之一。百度千帆的"量产式微调"工具在2025年服务了超过8万家企业客户,帮助他们以1—3天的周期完成针对特定业务场景的模型定制。

私有化部署支持:对于政府、金融、医疗等数据敏感客户,私有化部署(将模型权重和推理服务全部运行在用户自身的算力环境中)是非谈不可的条件。华为云在这一维度具有独特优势——其ModelArts平台与昇腾算力深度集成,可以为客户提供"数据不出域、模型不出域"的全套私有化方案,在政务和金融客户中具有相当强的竞争力。

生态工具与插件市场:类似应用商店模式的插件市场允许第三方开发者贡献行业特定的工具(法律合同分析插件、医学文献摘要插件、财务报表解析插件等),平台方从调用收入中分成。这一模式在2025年仍处于早期探索阶段,但已初现雏形。

定价与计费灵活性:面向高调用量的大客户的批量折扣、面向开发者的免费试用配额、面向特定行业的政策性优惠,共同构成了平台吸引不同层次客户的定价杠杆。DeepSeek以约0.001元/千词的超低价格打乱了市场定价体系,倒逼竞争对手重新设计竞争性定价策略。

5.4 行业垂直模型:六大赛道的深水区

行业垂直模型的核心价值不在于通用性,而在于对特定行业数据、流程和监管合规的深度适配。以下六大赛道在2025年进入快速商业化阶段:

金融AI:同花顺(300033)、东方财富(300059)将大模型嵌入量化研究、投顾推荐与风控报告,同花顺AI投顾月活超300万;第四范式(HK 6682)在银行信贷风控和零售营销场景落地,FY2025全年营收约35亿元(港元)。

政务AI:拓尔思(300229)、科大讯飞在政务大数据与智能客服上具有先发优势,科大讯飞2025年前三季度营收近170亿元,星火大模型相关项目中标金额全年行业第一。

医疗AI:百川智能"All in"医疗,聚焦百小应AI儿科、AI全科、精准医疗;联影医疗、推想科技在影像AI上持续深化。医疗AI的商业化门槛最高,需经医疗器械注册审批。

工业AI:创新奇智(HK 2121)专注工业视觉质检与工艺优化,服务富士康、宝武等超大型制造客户;美的集团通过内部5000余名员工的Agent化降本约40%,是工业AI规模落地的标志性案例。

教育AI:科大讯飞AI学习机收入2025年翻倍;作业帮、猿辅导将大模型嵌入个性化作业批改和错题分析,订阅收入持续增长。

法律AI:元典法律、聆心智能、鱼丸科技聚焦合同审查、法律检索、判决预测等细分场景,2025年相关赛道融资热度持续。

5.4.1 工业AI:从质检到工艺优化的完整路径

工业AI是最能体现AI大模型"降本增效"价值的场景之一,也是制造业企业采购AI解决方案意愿最强的方向。工业AI的应用场景可以分为四个层次,复杂度和价值量依次递增:

第一层:视觉质检与缺陷检测。这是工业AI最成熟的应用,已经有5年以上的商业化历史。AI视觉质检系统替代人工目检,漏检率可从约0.3%—0.5%降至约0.01%—0.05%,同时实现24小时全天候运行。创新奇智(HK 2121)的工业视觉产品已服务于富士康、博世、宝武等超大型制造客户,典型项目年化合同金额在500万—5000万元人民币。

第二层:预测性维护与设备健康管理。通过将大模型嵌入设备传感器数据的分析链路,提前预测设备故障并给出维修建议,可将计划外停机时间减少约30%—50%。阿里云、腾讯云、华为云均推出了面向制造业的预测性维护解决方案,已在钢铁、化工、汽车制造等高价值设备行业形成稳定客户。

第三层:工艺参数优化与生产排程。这是工业AI价值量最高、技术门槛也最高的场景之一。工艺参数优化涉及多变量实时分析——以钢铁连铸工序为例,影响铸坯质量的参数超过300个(包括钢水温度、拉速、冷却水量、结晶器振动频率等),传统上由经验丰富的工程师根据经验调整,每次参数调整后需要等待若干小时才能看到质量反馈。AI工艺优化系统通过实时采集设备传感器数据,建立"工艺参数→产品质量"的预测模型,可以在毫秒级别给出参数调整建议,将质量合格率从约88%提升至约95%,对应的物料损耗和返工成本大幅降低。宝武集团(世界最大钢铁企业)在其多个钢厂部署了国内AI工艺优化系统,年节省成本估计超亿元。

第四层:供应链全链路AI优化。覆盖从原材料采购预测(基于下游行业景气指数的大宗商品需求预测)、库存动态规划(多品类多仓位的最优库存水位计算)到物流调度(多仓多车辆的动态路径规划)的全链路优化。这一层次的工业AI最接近真正意义上的"Agent自主运作"——一个供应链AI Agent可以在无人干预的情况下,实时响应市场变化,动态调整采购计划、生产节奏和发货策略,将企业的供应链响应速度从原来的"天级"压缩至"小时级"甚至"分钟级"。

这四个层次的累计市场规模,在中国制造业(按GDP贡献约28万亿元计算,AI渗透带来的效率提升按2%—5%估算)的潜在价值空间约在5000—14000亿元之间——即便保守实现这一空间的10%,也意味着工业AI在2030年之前有数百亿元以上的增量市场待释放,是整个AI产业链中最有长期确定性的ToB赛道。

第三层:工艺参数优化。这是价值量最高但落地难度也最大的方向。大模型通过分析历史工艺数据(温度、压力、转速、物料配比等多维参数)与质量结果之间的关系,给出工艺参数的优化建议。在精密制造领域,工艺参数提升1%可能意味着数千万元的良品率改善。第四范式(HK 6682)的工业AI平台在半导体封测和化工流程优化上已有规模化部署案例。

第四层:研发加速与仿真。这是目前商业化最初级的方向,大模型辅助材料研发(发现新材料配方)、结构仿真(替代部分有限元计算)和专利分析,处于从大型企业研究院的试点向规模化推广的过渡阶段。

5.5 应用层:ToB与ToC的双线并进

ToB应用的核心痛点是"从POC到规模化部署"的鸿沟:企业愿意试点,但真正形成百万级ARR的案例仍然有限。推动跨越这一鸿沟的关键因子有三:安全合规(数据不出域、私有化部署)、ROI可量化(成本节省/效率提升有直接数字)和标准化封装(从定制项目到可复制产品)。2025年最成功的ToB案例集中在编程辅助(GitHub Copilot渗透率超30%)、文档处理(WPS AI月活2951万)和客服自动化(多个头部互联网企业自用节省客服成本30%—50%)。

ToB AI的商业化有几个容易被忽视的结构性规律:

规律一:技术评估≠采购决策。许多初创AI公司在技术评测环节表现优异,但最终采购决策落给了百度、华为等大厂,核心原因是企业采购决策不仅看技术,还要考量供应商风险(初创公司是否会倒闭?服务连续性能否保障?)、原厂支持(是否有7×24小时的本地服务团队?)和生态锁定(与现有IT基础设施的兼容性)。这一规律意味着初创AI公司进入大型企业采购清单的关键,往往不是技术突破,而是品牌建设和联合方案(与系统集成商SI合作打包服务)。

规律二:"第二份合同"是商业模式的真正验证。ToB AI的单次项目交付不等于稳定ARR,客户是否在初次项目后续签、扩大范围,才是商业模式健康的核心指标。第四范式、科大讯飞能够维持相对较高的续约率,关键在于将技术服务与客户的业务场景深度绑定(而不是交付一个独立的工具)——客户替换AI系统意味着重新培训、数据迁移、业务流程调整,替换成本极高。

规律三:国内ToB的付款周期偏长。政府采购的付款周期通常为合同签署后90—180天,大型企业付款周期约60—120天,而AI创业公司的月度算力成本是实时产生的。这一资金时差对创业公司的现金流管理构成实质压力,部分公司因此采用"先收预付款/保证金"的项目启动机制。这也是头部大厂(有充足的自有现金流垫付)在ToB市场相较创业公司具有独特优势的原因之一。

ToC应用的核心问题是"如何实现从免费到付费的转化"。字节豆包/即梦AI/豆包爱学合计月活约2.5亿,但付费会员渗透率仍低;Kimi通过发布K2.5获得海外ToB客户的直接付费,在20天内超越了2025年全年收入;MiniMax海螺的出海收入占比超70%,是中国AI应用出海最成功的案例之一。

5.5.1 ToC应用:付费转化率与用户黏性的破局路径

面向消费者的AI应用在2025年面临一个普遍难题:月活庞大但付费率偏低。豆包、Kimi、元宝的月活合计已超过3亿,但付费会员渗透率估计整体不超过5%,这与Netflix(约30%付费渗透率)、Spotify(约27%)等成熟内容订阅产品差距悬殊。

破局路径主要有三条:

路径一:强绑场景。当AI工具深度嵌入用户的核心工作流时,替代成本极高,付费意愿自然提升。WPS AI月活2951万中的付费转化率远高于通用AI助手,原因在于用户在写文档时离不开AI的实时辅助;科大讯飞AI学习机的家长续费率超过80%,原因在于孩子已经形成依赖该设备做作业的习惯。这一路径的本质是"刚需化"——让AI成为用户完成某项任务的必要工具,而非可选的效率增强。

路径二:差异化高端能力。免费层提供基础能力,付费层提供显著更强的能力(更长的上下文、更快的推理速度、更复杂的任务执行能力、更多的工具调用权限)。这一路径的挑战在于,随着免费模型能力快速提升,"足够好"的门槛不断抬高,需要持续投入能力领先。

路径三:出海溢价。在中国市场付费意愿有限的背景下,将产品推向付费能力更强的北美、欧洲和日本市场,以更高的单价弥补国内的低转化率。MiniMax出海收入占比超70%,Kimi K2.5主打海外企业用户付费,都是这一路径的典型案例。

从长周期视角看,面向消费者的AI应用的商业化天花板可能远高于目前的预期,关键变量是AI辅助工具的"刚需场景数量"——随着AI能力持续提升,越来越多的日常任务将形成对AI的结构性依赖,届时付费渗透率有望逐步接近内容类订阅产品的水平。

5.6 Agent:从工具到自主执行

Agent是2025—2026年最受资本追捧的方向,其本质是让大模型从"回答问题"升级为"执行任务"——通过工具调用(搜索、代码解释器、浏览器操作、API接口)和多轮规划,在人类给出目标后自主完成一系列步骤。OpenAI Operator于2025年1月23日发布,Claude Computer Use/Agent SDK于2024年末发布并持续迭代,Manus(蝴蝶效应公司)于2025年3月发布后在一周内积累50万候选用户,并于2026年5月被Meta以逾20亿美元收购。

企业Agent落地的数据同样令人瞩目:谷歌云调研显示,52%使用生成式AI的企业已在生产环境部署Agent,Salesforce预测2026年底前80%的企业应用将嵌入Agent能力。从中国来看,字节"扣子(Coze)"平台、百度ERNIE Agent平台、阿里钉钉AI助理Agent均实现了面向B端的规模化分发。

5.6.1 智能体的技术架构演进:从单一调用到多智能体协同

2025年Agent技术架构的演进可以归纳为三个阶段:

第一阶段(2023年—2024年上半年):反应式单智能体。用户输入一个任务,大模型分析任务并调用预定义的工具集(网页搜索、代码执行、文件操作),完成任务后返回结果。这一阶段的智能体能够完成有限复杂度的任务,但缺乏跨任务的记忆和自我修正能力。

第二阶段(2024年下半年—2025年):有记忆的规划型单智能体。大模型引入持久化记忆机制(存储过去对话的关键信息)和多步规划能力(将复杂目标拆解为有序的子任务序列),并在每个步骤执行后评估结果、动态调整后续计划。Manus(2025年3月)和OpenAI Operator(2025年1月)是这一阶段的代表产品,可以在数小时内自主完成包含数十个步骤的复杂任务(如撰写完整的竞品分析报告、从零开始搭建一个网站)。

第三阶段(2025年下半年至今):多智能体协同系统。将复杂任务分配给多个专门化的子智能体并行处理,主控智能体负责协调和整合子智能体的输出。这一架构使得处理企业级复杂业务流程成为可能——一个法律合规审查任务可以同时由"合同条款解析智能体""风险识别智能体""案例检索智能体"并行工作,最后由"整合报告智能体"汇总。

在标准化方面,模型上下文协议(MCP)在2025年被主流大模型厂商广泛采纳,标准化了智能体与外部工具、API、数据库之间的交互接口。MCP协议的推广相当于为AI智能体建立了统一的"USB接口标准",使第三方工具提供商无需为每家大模型厂商单独开发适配层,显著降低了智能体生态的碎片化程度。

5.7 AI设备:硬件是商业化的最快路径

AI设备是当前大模型变现效率最高的形态之一:硬件一次性购买实现现金流入,软件订阅贡献持续ARR。2025年AI设备生态的核心变化是端侧大模型(3B—13B参数)在旗舰手机上的实时运行成为标配——高通Snapdragon X Elite、苹果A18 Pro、联发科Dimensity 9400均专为端侧LLM推理优化。

AI手机:IDC预测2026年中国市场AI手机出货量达1.47亿台,同比增长31.6%,占整体市场53%;全球AI手机2026年出货量预计突破6亿台。小米、华为、荣耀、OPPO、vivo均推出"全程AI"旗舰,AI功能从修图扩展至实时翻译、跨应用调度和端侧Agent。

AI PC:Canalys预测2025年AI PC出货量超1亿台,2028年将达2.05亿台;2026年AI PC在PC新机出货中占比预计超50%。搭载NPU的AI PC将成为端侧Agent的重要运行节点,微软Copilot+PC生态与苹果Apple Intelligence是两大主线。

AI眼镜:Meta Ray-Ban智能眼镜于2025年下半年销量突破,国内字节、小米、华为、OPPO、百度等相继发布或宣布智能眼镜产品。IDC预测2026年全球智能眼镜出货量超2370万台,预计2026年全球AI眼镜出货量突破3000万台,正式进入大众消费品量级。

5.7.1 AI眼镜:下一个十亿级智能硬件赛道的早期信号

在所有AI设备品类中,智能眼镜是2025年变化最剧烈、预期改写最大的品类。Meta Ray-Ban智能眼镜的爆发(2025年下半年出货量突破数百万台)证明了"语音优先、摄像头辅助"的交互模式在大众消费群体中是可接受的——用户愿意为一副外形普通、实际嵌入了AI语音助手和摄像头的眼镜支付约300—500美元的溢价。

中国品牌在智能眼镜赛道的布局在2025—2026年集体加速:字节跳动与眼镜硬件厂商合作推出搭载豆包大模型的AI眼镜;小米则通过与眼镜制造商的合作切入这一品类;华为推出自研智能眼镜产品,主打与华为手机生态的深度联动;百度、OPPO等亦纷纷宣布相关产品线规划。

从供应链角度看,AI眼镜的主要元器件包括:微型扬声器与麦克风(用于语音交互)、摄像头模组(用于视觉感知)、骨传导或开放式耳机(用于音频输出)、超低功耗SoC(用于本地推理与连接管理)、以及可穿戴电池(通常嵌入镜腿中)。其中最关键的差异化硬件是摄像头与计算单元的集成方案——如何在镜片重量不超过5克的约束下实现实时视觉分析,是当前硬件工程的核心难题。

IDC预测2026年全球智能眼镜出货量超过2370万台,市场研究机构普遍认为,2027—2028年将出现"AI眼镜的iPhone时刻"——一款外形精美、能力全面、续航达标的旗舰产品引爆大众市场,届时年出货量有望突破1亿台。这一赛道对散热设备(超薄均热板)、存储设备(超低功耗闪存)和电子元器件等供应链方向的拉动效应已经开始显现。

5.8 数据与安全:被低估的基础设施

大模型的能力上限取决于训练数据的质量与多样性;企业部署的安全底线则取决于数据治理与模型对齐的成熟度。2025年中国数据要素市场进入加速期,全国数据交易所累计挂牌数据集数量突破50万,数据资产入表政策落地推动企业重新审视数据资产价值。

AI安全侧,RLHF(人类反馈强化学习)和Constitutional AI(价值对齐方法)已成为商业大模型必须通过的安全基准。中国强制要求备案时通过安全评估,GB/T 45654-2025标准的落地使AI安全测试形成可量化的产业链需求,推动AI安全评测企业(安恒信息、山石网科、奇安信等)开辟新的收入来源。

5.8.1 高质量预训练数据:稀缺资源的新一轮争夺

如果说2022—2023年大模型竞争的核心资源是算力(谁有更多GPU谁就赢),那么2025年以后这一逻辑正在被修正:算力可以购买,但高质量的数据(尤其是需要人工精心筛选和标注的专业数据)无法简单购买或复制。

当前全球互联网上的公开高质量文本数据已基本被主流大模型的训练语料耗尽——即所谓的"数据墙"(Data Wall)问题。为了突破这一瓶颈,头部玩家采取了以下策略:

第一,从用户交互中获取数据飞轮。拥有大量真实用户的产品(ChatGPT、豆包、Kimi)能够持续收集用户的提问方式、偏好反馈和纠错信号,这些数据用于模型的强化学习对齐,形成"用户越多→模型越好→用户越多"的正向循环。

第二,合成数据生成。让已有的大模型生成更多训练数据(如数学解题过程、代码注释、多步推理样本),再用这些合成数据训练下一代模型,形成"自我提升"(Self-Play)的数据增强路径。DeepSeek-R1的成功很大程度上依赖了这一方法——用DeepSeek-V2生成大量推理过程数据,再用这些数据训练R1的推理能力。

第三,专有行业数据的排他采购。医疗影像标注数据、法律判决文书、金融财报解读、工厂工艺参数等专有数据集,成为行业大模型玩家的核心资产。部分创业公司甚至直接收购具备数据资产的传统行业公司,以获取无法通过爬取公开网络获得的高价值数据。

六、重点企业深度分析

6.0 中国AI大模型公司的梯队划分(2026年6月)

在进入逐家企业分析之前,先建立一个清晰的梯队框架,有助于理解各家公司的相对位置和竞争逻辑:

第一梯队:资源驱动型超级平台(四家) 百度、阿里巴巴、字节跳动、腾讯四家互联网巨头,共同特征是:自有海量训练算力(自建超大规模GPU集群)、庞大的用户数据飞轮(百亿级日活场景数据)、强大的工程师团队密度(AI工程师均超千人)。竞争策略是"全栈布局、生态牵引"——从算力底层到模型中层到应用顶层的全链路控制,以生态粘性(阿里云/钉钉/淘宝、微信/企业微信/腾讯视频、抖音/飞书/火山引擎)实现用户锁定。

第二梯队:技术效率型黑马(四家) DeepSeek、月之暗面(Kimi)、MiniMax、智谱AI四家创业公司,共同特征是:在有限算力资源下取得了不成比例的技术突破,形成了全球范围内的技术口碑。竞争策略是"技术差异化+出海变现"——以低成本高性能的模型在全球API市场建立份额,同时在特定垂直场景(长上下文理解、音频多模态、企业私有化)形成差异化壁垒。这一梯队面临的核心挑战是:如何在融资期结束后实现可持续的商业化,在与第一梯队长期竞争中守住独立发展的空间。

第三梯队:垂直行业深耕型(多家) 科大讯飞(语音/教育/政务)、金山办公(办公软件AI化)、商汤(视觉AI/具身智能)、第四范式(企业决策AI)、百川智能(医疗AI)等,共同特征是:在特定行业有深厚的场景积累和客户关系,以行业Know-how和数据积累构建护城河,不追求通用模型的能力边界。这一梯队的商业化确定性最高(均有亿元以上的稳定营收),但增长速度相对慢于第二梯队。

理解这三个梯队的分层,有助于避免一个常见错误:用同一套评价标准去判断不同梯队的企业。第一梯队靠生态规模赢,第二梯队靠技术突破赢,第三梯队靠行业深度赢——三种逻辑下的成功路径完全不同。

6.1 百度文心(ERNIE)

百度是中国AI大模型商业化的最早布局者,文心大模型从ERNIE 3.0到5.0经历了七年的持续迭代。2025年文心大模型日均调用量突破16.5亿次(较2023年同期5000万次增长33倍),文心5.0 Preview在国际评测中进入全球第二梯队,位居国内第一。百度智能云AI公有云市场份额保持19.9%稳居中国第一(连续五年)。

2025年商业化策略的重大转变:文心一言2025年4月1日全面免费(PC和App端),大幅降低用户门槛,以流量规模换商业化深度。与此同时,百度宣布将于2026年6月30日开源文心4.5系列,加入开源生态竞争。百度旗下的"文心一格"图像生成、"文心智能体平台"等应用矩阵持续丰富,AI收入在智能云业务中占比持续提升(2025年同比增速约26%,AI云收入增速约3倍)。

从更深层次分析百度的竞争态势,有几点值得关注:百度在AI领域的技术积累深度(飞桨深度学习框架、文心系列的连续投入)使其在大模型生态基础设施层具有相当的先发优势;但在消费者端,百度面临字节豆包、腾讯元宝的激烈竞争,流量入口的搜索引擎地位也面临AI搜索(如Perplexity、秘塔AI)的长期侵蚀威胁。百度的核心战略是以智能云企业服务为基础盘(ToB占大头),以百度地图、百度搜索的流量生态为变现抓手,在AI原生应用上深耕出行(Apollo自动驾驶)、营销和企业服务三大垂类。

在算力自主可控方面,百度自主研发的"昆仑芯"是中国最早实现规模量产的AI推理芯片之一,2025年昆仑芯2代在百度内部的推理集群中已具备相当规模的部署,有助于降低对英伟达供应链的依赖。

6.2 阿里通义千问(Qwen)

阿里是2025年全球开源生态建设最积极的巨头之一。2025年4月29日,Qwen3正式开源,一次性发布0.6B至235B共8款模型,覆盖混合专家架构和密集架构两种技术路线;2025年9月,阿里云在杭州云栖大会上发布Qwen3旗舰版,预训练数据量达36万亿词元,总参数超万亿,在编程和智能体工具调用能力上跻身全球前三。

截至2025年底,通义千问开源200余个模型,全球下载量超3亿次,Hugging Face上衍生模型超10万个,正式超越Llama成为全球下载量第一的开源模型生态。2025年11月,通义App更名为"千问"并升级至5.0版本,标志着消费端产品进入新发展阶段。阿里云2026年第一季度营收同比增长超20%,AI相关云服务贡献增量最大。

阿里在大模型战略上的独特之处在于"开源换生态"的长线布局。通过将顶尖能力的模型开源,阿里吸引了全球数以十万计的开发者在Qwen基础上构建垂直应用,这些衍生应用反过来验证和扩大了通义千问的商业应用场景版图。同时,开源策略也为阿里云的企业服务(私有化部署、模型微调、推理服务)提供了源源不断的线索——很多企业开发者在开源平台验证概念后,会自然转化为阿里云的付费用户。

在产品侧,通义的多模态能力在2025年取得显著进展:通义万相(图像生成)、通义听悟(语音转文字与摘要)、通义灵码(代码辅助)形成了覆盖不同工作场景的应用矩阵,与钉钉和阿里云企业服务深度集成,形成阿里巴巴商业生态内的AI能力统一入口。

6.3 字节跳动豆包与火山引擎

字节跳动的AI布局以"产品端+基础设施端"双线并进著称。产品端,豆包、即梦AI(图像/视频生成)、豆包爱学三款AI App在2025年Q4合计月活约2.5亿,豆包在中国AIGC App月活中占据近半壁江山;面向海外的Dola AI助手日活已突破千万。基础设施端,火山引擎提供自研大模型(豆包系列)+云算力+推理服务,字节2025年日均Token处理量超过50万亿,是全球最大的推理算力消耗方之一。

CEO梁汝波在2026年全员会上将豆包/Dola定义为字节"翻越的第一座高峰",显示出战略重心向AI应用商业化的明确倾斜。字节2025年总营收预估约1860亿美元(+20%),净利润约500亿美元,AI投入不设上限。

字节豆包的竞争策略值得单独分析。相较于百度的"技术积累驱动"和阿里的"生态开源驱动",字节采取了"流量变现驱动"路线——凭借抖音、TikTok的极强用户流量基础,以最低边际成本将豆包的AI能力触达最广泛的用户。这一策略的优势在于:用户获取成本接近零(已有流量池),变现路径短(AI功能嵌入已有内容消费场景),迭代反馈快(海量真实用户行为数据)。

在技术上,字节豆包系列(豆包Pro、豆包Vision、豆包MoE)在语言、图像理解和视频生成上保持了与国内第一梯队相当的能力水平,但字节更大的差异化并不在于"比竞争对手的模型强多少",而在于其将AI能力嵌入用户既有使用习惯(在抖音看视频→豆包读懂你的偏好→在豆包继续深度对话)的分发效率优势。在即梦AI方面,字节将视频生成能力与抖音内容生产链路打通,为抖音创作者提供从脚本到成片的AI辅助,是字节AI商业化中最有潜力的B2B赛道之一——视频创作服务的企业订阅定价可达数百至数千元/月,且用户粘性高。

字节在出海赛道的布局同样值得重视:Dola(海外AI助手)在东南亚和北美的月活持续增长,字节通过TikTok的海外用户基础具有其他中国AI公司无法复制的出海分发优势,但美国的政治压力(TikTok禁令法案)为这一优势蒙上了不确定性。

6.4 腾讯混元与元宝

腾讯2025年全年营收7518亿元,AI驱动盈利创历史新高,2025年AI专项投入(混元+元宝)达180亿元,第四季度单季投入70亿元。元宝(C端助手App)月活突破1亿,AI工作台ima月活超1300万,跻身国内AI原生应用Top3。腾讯2026年Q1 ToB营收达549亿元,AI+云贡献增量显著。

混元大模型于2025年进行体系重构,分设大语言模型部和多模态模型部;混元3.0将于2026年4月发布。腾讯的独特优势在于微信/QQ生态的12亿月活基础——将AI能力嵌入微信小程序、企业微信、腾讯文档,可以实现最低成本的ToC渗透。

6.4.1 腾讯AI生态的独特竞争位置:社交流量的AI化变现

在所有中国互联网巨头中,腾讯的AI变现路径最具独特性——它拥有其他任何公司都无法复制的资产:微信月活12亿的深度社交关系网络和基于此建立的支付、小程序、企业服务生态。

这意味着腾讯的AI不需要单独获取用户,只需将AI能力嵌入用户每天已经在使用的产品中。微信输入法的智能联想、朋友圈内容的AI辅助创作、企业微信的AI客服、腾讯文档的AI写作助手——每一个触点都在以零边际获客成本实现AI功能的渗透。相比之下,百度、豆包等需要独立获取并留存AI用户,获客成本和流失风险均显著更高。

混元大模型的商业化路径因此也与竞争对手不同:与其说是"出售大模型能力",不如说是"以大模型能力增强既有产品黏性和变现效率"。微信公众号的AI辅助写作工具可能并不单独定价,但它提高了内容创作者在平台上的活跃度和付费率;腾讯游戏的AI客服降低了用户投诉处理成本;腾讯广告系统的AI创意生成工具提升了广告主的投放ROI。

2025年腾讯在AI方面的总研发和资本开支投入约1500亿元(含算力基础设施),这一数字显示出腾讯已将AI视为与移动互联网同等重要的平台级战略,而非一个可选项目。

6.4.2 百度、阿里、字节、腾讯AI投入横向比较(FY2025)

理解四大互联网平台在AI上的真实投入体量,对准确判断各自的战略决心至关重要。以下数据基于各公司2025年公开财报及可靠媒体披露:

百度:2025年全年AI总投入(含研发和资本开支中AI相关部分)估计约300亿元人民币,其中算力基础设施约200亿元、模型研发约70亿元、应用产品约30亿元。受云业务增长提速(AI云收入增速约3倍)影响,2025年百度智能云的AI相关营收约200亿元,构成百度股价的核心估值支撑。

阿里巴巴:2025财年(截至2025年3月)资本支出约1166亿元人民币(约165亿美元),较2024年同期大幅增加,主要用于云计算和AI基础设施扩张。2026年Q1(截至2025年6月底)数据在公告时点尚未披露,但阿里管理层明确表示2026财年将大幅超越2025财年的资本支出水平。通义千问相关云服务贡献了阿里云约20%的营收增量。

字节跳动:字节官方不单独披露AI投入,但据媒体估计2025年AI基础设施投入不低于500亿元人民币,且管理层明确表示"AI投入不设上限"。从实际结果看,字节的AI布局在算力规模上已接近国内最大的云厂商,自建推理集群规模推测在10万卡以上。

腾讯:2025年全年AI专项投入(混元+元宝)约180亿元,Q4单季约70亿元,呈现加速态势。腾讯更大规模的算力资本开支(包括GPU服务器数据中心建设)超过1500亿元全年总资本开支,AI相关部分估计占比约30—40%。

四家合计AI投入(含算力)约3000亿元人民币,是中国AI产业基础设施快速成型的最核心推动力。

6.4.3 2026年大模型竞争的关键转折点

2026年对中国AI大模型产业而言是一个多维度的关键转折年,以下几个具体节点将对全年竞争格局产生深远影响:

节点一:百度文心4.5系列开源(2026年6月30日)。百度宣布在此日期开源文心4.5系列,意味着中国最资深的大模型公司正式加入开源生态的竞争。若文心4.5的开源版本能力达到Qwen3同级水平,将进一步拉低行业推理成本基线,倒逼所有付费大模型服务做出定价调整。

节点二:MiniMax港股IPO。2025年底通过聆讯,2026年上半年预计完成IPO的MiniMax,将成为中国AI大模型创业公司的第一个公开市场定价锚点。其发行市盈率和市值,将为后续智谱AI、月之暗面等公司的估值谈判提供重要参考,也将推动整个行业从"一级市场估值逻辑"向"公开市场盈利逻辑"的转变。

节点三:DeepSeek V4/R2的预期发布。自V3(2024年12月)到V4的迭代周期,按照幻方科技的研发节奏预计约6—9个月,即2025年下半年至2026年初可能发布。V4的能力水平将决定DeepSeek能否继续扮演"全球成本曲线重写者"的角色,还是在能力提升放缓后被竞争对手反超。

节点四:Agent规模化落地的Q3效应。多家市场调研机构预计2026年Q3(7—9月)将出现企业Agent规模化落地的"爆发拐点"——在这一季度,使用AI Agent自主处理企业任务的工作量占比有望首次突破10%(即10%的企业工作流已由AI Agent代替人工执行),届时"Agent带来的生产力提升"将从文档中的数字变为企业财务报表中的真实成本节约,加速下一轮采购决策。

6.5 DeepSeek:重写成本曲线的技术颠覆者

DeepSeek由量化私募幻方科技孵化,是2025年最具影响力的技术黑马。2025年1月20日,DeepSeek-R1开源发布,采用GRPO强化学习方法,在数学、代码、推理任务上媲美OpenAI o1,而整体训练成本仅约560万美元;随后发布的DeepSeek-V3(6850亿总参数/370亿激活参数)在多项评测超越Claude Sonnet/GPT-4o。API定价仅为OpenAI的1/10,迫使全行业跟进降价。

在竞争格局层面,DeepSeek的影响超越模型本身——其发布一个月内,OpenAI宣布推出更多免费层,百度宣布文心全面免费,谷歌加快Gemma开源节奏。2025年DeepSeek生态基金规模达万亿,目标孵化10万AI Agent开发者。DeepSeek不直接面向消费者运营,以开源+API批量授权的方式构建商业闭环,2026年ARR估计约100—150亿元。

从更宏观的产业视角审视DeepSeek现象,其真正的历史意义有三个层次:

第一层:证明了工程效率路线的可行性。在英伟达H800(已受出口管制)而非H100的约束条件下,DeepSeek团队通过算法创新(MLA注意力机制减少KV Cache显存占用60%、FP8混合精度训练节省显存40%、细粒度Expert路由减少无效计算)将训练效率提升到令行业惊愕的程度。这一证明具有深远影响:它表明算力约束未必是中国AI发展的天花板,工程创新本身可以成为战略武器。英伟达在DeepSeek发布后市值单日蒸发约5890亿美元,是资本市场对"算力神话"重估最直接的表达。

第二层:重塑了全球AI成本基准。DeepSeek-V3 API输入定价约0.27美元/百万token(输出约1.1美元),相比GPT-4o的5美元/15美元,成本仅为1/10—1/15。这一定价信号传递给全球开发者一个不可忽视的信息:AI API已经从"奢侈品"变成"基础设施",其成本将持续向零靠拢。这一成本曲线的重塑,加速了全球AI应用层的爆发——当API成本不再是限制因素,大量此前因成本无法商业化的场景开始变得可行。

第三层:开创了中国AI"技术输出"而非"产品输出"的新路径。过去中国科技出海主要依赖TikTok、电商、游戏等消费品形式;DeepSeek通过纯技术开源的方式,在不进入任何消费者市场、不在海外设立任何机构的情况下,让其技术成果被全球数百万开发者采用。这是一种全新的技术影响力传播模式,绕过了传统出海面临的品牌建设、监管合规、本地化运营等高成本门槛。

6.6 智谱AI(GLM Z.AI)

智谱AI是清华系技术背景最深厚的大模型创业公司,GLM系列模型从GLM-4到GLM-5持续迭代,在长文本理解和代码能力上具有特色。2025年智谱AI启动港股IPO进程,预计募资约3亿美元。商业化方面,面向开发者的GLM coding plan年化收入已超1亿元,预计2025年总营收实现100%以上增长。2026年初在OpenRouter等平台上,GLM-5在全球开源模型调用量中位居前五。

智谱AI在技术积累上有三个独特之处:第一,来自清华大学AI技术体系的深度渊源——创始团队长期在清华计算机系和自然语言处理实验室工作,在预训练数据工程和指令微调方法上有深厚积累;第二,在代码生成能力上的早期专注——早于多数竞争对手在代码大模型(CodeGLM)方向进行深度投入,积累了面向开发者用户的差异化口碑;第三,在双语和多语言能力上的持续优化——GLM系列在中英文双语的指令遵循和跨语言理解上保持了较高水准,是出海方向的技术基础。

商业化上,智谱面临的核心挑战是"在互联网巨头(阿里、字节、腾讯)和资金更充裕的创业公司(月之暗面、MiniMax)之间找到差异化位置"。目前最有竞争力的差异化是"企业私有化部署+开发者生态"的组合路线——GLM开源版本在企业私有化场景的部署数量可观,配套的企业服务(高级微调、安全审计、本地运维支持)提供了有竞争力的商业收入。IPO成功后,资金将主要用于扩大算力基础设施和研发团队,以保持与一线大模型的能力跟进。

6.7 月之暗面(Kimi)

月之暗面以"长上下文+网页阅读"为核心差异化优势,Kimi在2025年2月面临DeepSeek冲击后果断收缩广告投放,转向技术本身——投入K2万亿参数MoE大模型研发,并在医疗、法律等垂直场景深化布局。

2025年底完成5亿美元C轮融资,估值达180亿美元。2026年初,Kimi发布K2.5模型,主打出海ToB用户,在不到20天内的收入超越2025年全年总收入,成为中国AI应用出海的里程碑式案例。月活数据方面,由于大幅削减投流,Kimi App月活相较峰值有所下降(据媒体报道约"腰斩"),但用户质量和付费率显著提升。

月之暗面的战略转型过程是中国大模型创业公司面对DeepSeek冲击的典型应对范本。2025年2月DeepSeek-R1发布后,Kimi的月活从峰值3000万大幅下滑,原因在于此前靠密集广告拉来的"尝鲜用户"在免费高质量替代品出现后快速流失。

月之暗面的应对策略分三步:第一步,立即砍掉大量低效广告投放,将省下的预算集中投入K2模型研发;第二步,将C端产品定位从"通用AI助手"调整为"深度长文档理解助手"(Kimi的真实差异化能力),集中服务对长上下文有刚性需求的高付费用户(律师、分析师、学者);第三步,将B端API接口向海外用户开放,以远低于OpenAI/Anthropic的定价切入全球API市场。

K2.5在20天内超越2025全年收入的案例,证明了一个重要的商业逻辑:在全球市场,中国AI模型的成本优势(约为同类美国模型的1/5—1/10)是真实的竞争壁垒,而全球开发者和企业用户对此有足够的理性付费意愿。这与中国ToC市场的低付费意愿形成了鲜明对比,也解释了为什么MiniMax、Kimi都将出海作为2026年的战略重心。

6.8 MiniMax(海螺)

MiniMax是中国AI应用出海最成功的公司之一:C端社交AI、海螺AI(文本/音频多模态)等产品出海收入占比超70%,2025年底顺利通过港股上市聆讯,预计募资6—7亿美元,估值约40亿美元。

MiniMax在音频/音乐生成上具有领先优势,旗下Hailuo Video在短视频生成领域获得全球开发者广泛采用;在技术路线上,MiniMax坚持自研超大参数MoE基础模型(MiniMax M2等),是创业大模型公司中少数坚持"全栈自研"路线的之一。2026年初,MiniMax M2.5在OpenRouter全球模型调用量中位列第一,超越所有美国模型。

MiniMax的出海成功值得从商业模式角度做更深入的拆解,因为它代表了一种中国AI出海的"路线三"——不走监管敏感的美国ToB市场,也不走高品牌门槛的欧洲市场,而是直接面向全球API开发者市场以及政治敏感度较低的消费者市场:

MiniMax的核心变现来源是其C端AI社交产品(Talkie,类Character.ai的AI伴侣应用)在北美、日本、东南亚等市场的订阅收入,以及面向全球开发者的API服务。Talkie在App Store的月均收入在2025年下半年持续位居全球AI App收入排行前十,订阅单价约9.99—14.99美元/月,北美和日本用户的付费率远高于国内Kimi、豆包的中国用户。这直接证明了:当定价合理、产品满足真实需求时,全球用户愿意为中国AI产品付费,出海的障碍主要是政治地缘风险而非产品能力或品牌。

MiniMax在技术上的"全栈自研"策略,使其能够在推理成本上做到极致优化(自有模型+自有推理优化,避免了中间层的成本溢价),这是维持其在全球API市场价格竞争力的关键。2026年MiniMax M2.5成为OpenRouter调用量第一,意味着全球开发者已经实际使用其API服务进行商业产品开发,这是品牌认可度的最有力佐证。

6.9 科大讯飞(002230)

科大讯飞是中国AI"国家队"的代表企业,语音识别+大模型的组合覆盖教育、医疗、政务三大核心政府采购场景。2025年前三季度营收169.89亿元,大模型相关项目中标金额全行业排名第一,Q3单季中标金额5.45亿元;AI硬件(学习机)收入翻倍增长,海外营收突破10亿元(在拉美、东盟重点语种上局部超越美国产品)。

值得关注的是,科大讯飞在营收高速增长的同时仍面临利润压力(2025年前三季度净利润约2亿元,扭亏改善但仍薄),核心矛盾在于大模型商业化投入大、回收周期长。

科大讯飞的竞争壁垒建立在三层结构之上:

第一层:语音技术护城河(已形成)。讯飞星火语音识别在普通话、方言、嘈杂环境下的识别准确率长期处于国内第一,这一能力积累了20余年的工程经验和数十亿条有标注的语音数据,是其他大模型公司短期内极难追赶的硬核能力。语音识别作为AI的"耳朵",在医疗(病历语音录入)、政务(会议纪要自动生成)、教育(英语口语评测)等场景中不可或缺。

第二层:政府关系与合规能力(相对稳固)。科大讯飞与教育部、工信部、卫健委等核心政府部门的合作关系建立多年,熟悉政府采购的流程和合规要求,在政务AI市场具有门槛级的关系资产。这一层护城河的稳固性取决于政府AI采购政策的稳定性,在当前环境下预计2026—2028年不会发生根本性变化。

第三层:AI硬件终端的学习机爆发(正在形成)。AI学习机是科大讯飞转型"AI硬件+服务"的最重要抓手。一台3000—7000元的AI学习机,不仅贡献硬件毛利(约20—30%),还绑定了后续的课程内容订阅(每年数百至数千元)和AI辅导服务,形成"硬件+内容+AI服务"的三重收入结构。这一商业模式的长期价值在于:购买了学习机的家庭,其年均AI服务支出远高于纯App订阅用户,且设备更换周期(3—5年)提供了相对稳定的复购节点。

6.10 金山办公(688111)

金山办公是AI赋能传统软件最成功的中国案例之一。2025年全年营收59.29亿元(同比+15.78%),归母净利润18.36亿元,WPS AI月活在2025年6月底达2951万(较2024年底1968万增长50%),WPS AI 3.0发布,推出AI原生办公智能体"WPS灵犀"。

WPS 365企业版收入在2025年上半年同比大增62.27%,企业级AI办公市场正在快速放量;2026年Q1营收同比增长24%,AI、协作与国际化三线并进。金山办公的估值逻辑已从"传统办公软件"切换为"AI办公SaaS平台",市盈率估值显著扩张。

金山办公的AI战略在整个中国大模型产业中具有重要的参照意义,因为它代表了一种不同于"从零搭建AI公司"的路径——将既有的大型软件用户基础(WPS全球月活超过5亿)与AI能力深度融合,以"AI升级既有产品"代替"全新AI产品"的方式实现商业化。

这一路径的核心优势在于:现有用户的迁移成本极低——用户不需要学习新工具,只需要在已熟悉的WPS界面中发现AI功能;商业转化路径短——从免费WPS个人版到付费WPS AI会员的引导漏斗比全新App的拉新漏斗效率高得多;企业数据集成成本低——WPS文档本身就是用户的工作数据,AI自然嵌入工作流,无需额外的数据迁移工程。

金山办公面临的核心竞争威胁来自两个方向:其一,微软365 Copilot的国际化版本在外资/合资企业用户中渗透,这部分客户传统上是WPS难以渗透的市场;其二,字节飞书、钉钉等协同办公平台纷纷嵌入AI能力(豆包、通义),以"协作+AI"一体化方案争夺企业办公软件的核心客户。金山办公2026年的战略重心是通过WPS 365深度绑定政府和央企客户(这部分客户有强国产化替代需求,WPS是Word唯一主流替代),以及在海外继续推进WPS AI的国际化版本。

6.11 商汤科技日日新(HK 0020)

商汤以"日日新(SenseChat)"大模型为核心,在视觉AI、具身智能与AI基础设施三个方向深耕。2025年商汤生成式AI业务收入快速增长,大装置(AI训练算力服务)业务贡献可观;但公司仍面临亏损压力,需持续验证具身智能的商业化路径。

商汤的具身智能布局(SensePAD机器人平台、灵犀机械臂系列)是其区别于纯软件大模型公司的独特战略方向。具身智能(Embodied AI)将大模型的"认知能力"与物理机器人的"执行能力"结合,使机器人能够理解语言指令并在物理世界中执行复杂任务。商汤在这一方向上投入了大量研发资源,但具身智能的商业化路径比软件类AI更长——需要克服硬件制造、机器人可靠性、应用场景培育三重挑战,预计2027年前才能在特定场景(仓储物流、工厂装配)形成规模化收入。

商汤的大装置业务(向企业和政府机构提供AI训练算力基础设施)在2025年是增长最快的收入来源,但同时也是资本消耗最大的业务——需要持续采购和更新AI服务器GPU服务器,对现金流管理要求极高。

6.11 商汤科技日日新(HK 0020)

商汤以"日日新(SenseChat)"大模型为核心,在视觉AI、具身智能与AI基础设施三个方向深耕。2025年商汤生成式AI业务收入快速增长,大装置(AI训练算力服务)业务贡献可观;但公司仍面临亏损压力,需持续验证具身智能的商业化路径。

6.12 第四范式(HK 6682)

第四范式专注企业AI平台,Sage AIOS在银行、保险、零售等行业的私有化部署具有成熟方案。FY2025全年营收约35亿港元,增速约20%;获Gartner列入企业AI平台魔力象限,是中国企业AI平台出海的代表性公司。

第四范式的定位是"企业AI决策智能平台",其差异化不在于提供最强的基础模型,而在于提供一套让企业非技术人员也能构建和维护AI决策系统的工具体系(AutoML+特征工程自动化+模型监控)。这一定位使其在金融行业(信贷风控、精准营销、智能投顾)找到了最成熟的商业场景:大型商业银行的风控部门缺乏深度AI开发能力,但有强烈的AI辅助决策需求和充裕的采购预算,是AI平台企业的完美客户画像。

第四范式的出海战略正在向中东和东南亚延伸:2025年与阿布扎比金融监管局(ADGM)签署合作备忘录,为中东金融机构提供AI风控解决方案;在新加坡与多家本地银行进行概念验证。国际化路径的核心挑战在于:Sage AIOS的数据合规方案必须适配不同国家和地区的数据保护法规(PDPA/GDPR等),需要本地化法律合规投入。

6.13 阶跃星辰与百川智能:两支有特色的新势力

阶跃星辰(Step):由前Anthropic研究工程师和谷歌DeepMind研究员创立,以Step-2系列多模态大模型为核心,在图像理解和视觉推理能力上具有突出水准,2025年全年营收约5—8亿元,主要来自API调用和企业私有化部署。阶跃星辰在技术策略上专注于"多模态原生"——从模型设计之初就将图像理解和文本生成作为统一的预训练目标,而非训练完文本模型后再叠加视觉能力,这一架构选择在视觉密集型任务(设计辅助、工程图纸识别、遥感图像分析)上带来显著的能力优势。

百川智能:由前搜狗CEO王小川主导,战略核心是"All in医疗"——将AI大模型的能力聚焦于中国10万亿元规模的医疗健康市场,开发"百小应"等AI医生产品,主打基层医疗机构(约100万家基层诊所、社区卫生服务中心)的AI辅助诊断场景。医疗赛道的商业化节点取决于监管(三类医疗器械注册证),但一旦突破,在中国基层医疗体系的网络效应极强。百川在2025年启动港股IPO进程,医疗AI的长周期商业化逻辑是否能获得资本市场认可是关键考验。

6.12.1 国产AI芯片双雄:寒武纪与海光的差异化路径

在基础算力层,寒武纪(688256)与海光信息(688041)是2025年最值得关注的两家上市公司,其业绩表现也是国产AI算力放量最直接的财务佐证。

寒武纪(MLU系列)主打"通用图形处理单元架构"路线,追求最广泛的软件兼容性(目标是覆盖主流AI框架的绝大多数常用算子)。2025年上半年营收28.81亿元,同比增长4347.82%,实现扭亏为盈(净利润10.38亿元)——这一爆发式增长的背后是政府和央企采购的集中释放,以及公司在推理侧产品(MLU370和MLU580系列)上取得的工程突破。寒武纪的市值在2025年随业绩兑现大幅扩张,成为AI芯片国产替代最受资本市场关注的标的之一。

海光信息(深算一号系列,与AMD CPU协同的DCU架构)主打高性能计算和科学计算场景,在CUDA生态兼容性上通过"海光兼容层"实现了相对较高的软件迁移效率。2025年上半年营收54.64亿元,同比增长45.21%,净利润12.01亿元,增长较为稳健。海光的客户群体集中在互联网、高校科研和数值模拟密集的工业场景,与寒武纪的政府/央企重点客户群体形成错位竞争。

从2026年展望看,两家公司都面临相似的战略挑战:如何在软件生态(CUDA兼容层的完整度)和工程级稳定性上进一步提升,以赢得商业化互联网大厂(阿里、字节、腾讯)在推理集群扩张时的实质性订单。目前这两家公司在商业化大厂中的份额仍然偏低,2026年是验证能否从"政府市场到商业市场"跨越的关键年份。

七、产业集群:六大地理极与出海走廊

7.1 北京中关村:基础研究与互联网AI双极

北京是中国AI大模型的最大策源地。中关村—海淀区聚集了清华大学(智谱AI技术来源)、北京大学、中科院计算所等高校科研机构,以及百度、字节跳动、百川智能、阶跃星辰、月之暗面、面壁智能等创业大模型公司。截至2025年7月,北京以144款备案大模型居全国第一,占全国总量33%。北京AI产业链的最大优势是基础研究与工程化之间的距离极短——从论文到产品,往往不超过六个月。

在AI人才密度方面,北京是中国无可争议的AI研究人才中心:清华大学、北京大学每年输出数百名高质量AI研究生,形成了完整的"学术→创业→大厂"的人才循环。与硅谷的旧金山湾区类似,北京的AI顶级人才圈子相互熟识、流动频繁,信息传播速度快,这加速了新技术从实验室到产品的转化效率。

北京的AI产业政策同样是全国力度最强的:中关村科学城AI产业园提供土地、算力补贴和人才引进绿色通道;北京市AI专项基金(规模超百亿元)定向支持北京AI企业的融资和研发;海淀区政府将AI产业作为"3+5+X"产业战略的核心,在行政审批、数据要素开放和企业服务上给予最高优先级。

在AI硬件供应链中,北京周边的电子元器件集成电路制造配套相对完善,但与深圳、苏州相比整体制造业密度较低,这使得北京的AI公司更多依赖外省(苏、沪、粤)供应链完成AI硬件的实体配套。

7.2 上海徐汇张江:生物医疗AI+金融AI双核

上海的AI产业重心偏向垂直行业应用,尤其是医疗AI(联影医疗张江园区、推想科技、阿里巴巴上海AI研究院)和金融AI(摩根大通、高盛上海AI中心、东方财富、同花顺上海研发)。张江科学城聚集了大量半导体设计企业(壁仞科技、沐曦MetaX总部在上海),为AI芯片国产替代提供本地供应链。

上海徐汇滨江成为大模型独角兽落地的另一选择:MiniMax、阶跃星辰均以上海为研发总部,完整的机架服务器数据中心运营供应链在上海周边亦相对完整。

上海的AI产业竞争格局受其城市产业结构的深刻影响:作为中国最大的金融中心和国际贸易枢纽,上海的AI应用场景以跨国企业参与度高、数据规范程度高、专业服务要求高为特征,这使上海AI企业在金融科技(FinTech)和医疗科技(MedTech)领域的产品标准更接近国际水平,出海的合规门槛相对较低。

上海市人工智能示范区(徐汇西岸)提供了专属的AI数据要素流通实验区,允许跨机构数据的合规共享和联合建模,对医疗AI(需要多医院多中心数据)和金融AI(需要跨机构交易数据)的研发有独特价值。这一政策实验在全国其他城市尚未复制,是上海在特定垂类AI研发上的独特政策优势。

从供应链角度看,上海的IDC机房建设和光通信设备供应链同样成熟,金融机构对于将AI推理集群建设在本地数据中心内有强烈需求,为上海本地的AI算力供应商提供了稳定的客户基础。

7.3 杭州阿里生态:云+大模型一体化

杭州以阿里巴巴为核心,云+大模型+应用的纵向一体化优势全国最强。阿里云在杭州运营国内规模最大的智算集群,通义千问研发团队、达摩院核心人员均在杭州。以阿里为龙头,杭州还聚集了网易有道(教育AI)、恒生电子(金融科技AI)等AI应用企业。MiniMax杭州研发团队在2025年贡献了多项重要模型迭代。

杭州的IDC机房建设密集,服务器托管数据中心制冷配套成熟,为AI大模型训练提供优良的物理基础设施支撑。

杭州AI产业生态的一个独特优势,是阿里巴巴庞大的商业生态与AI能力的深度交叉——淘宝天猫的商品图片AI自动处理、菜鸟的AI路由优化、蚂蚁金服的AI风控、高德地图的AI导航、钉钉的AI协同——这些来自真实业务场景的海量标注数据,构成了通义千问能力在特定商业场景下精细化调优的天然优势,这是其他城市的大模型公司很难复制的产业护城河。

杭州政府在AI产业扶持上采取了"产业生态培育"而非"单点企业扶持"的策略,重点在于:开放蚂蚁集团、阿里云的匿名脱敏数据用于政府委托的AI研究项目;在云栖大会等平台提供持续的生态社区建设;与浙江大学AI研究院合作建立产学研一体化的AI联合实验室。这些措施共同构成了一个围绕阿里生态的完整AI产业培育体系,使杭州成为中国AI生态最完整、商业落地最快的城市之一(尽管备案大模型数量不及北京,但商业化应用的密度可能是全国最高的)。

7.4 深圳南山:硬件AI+工业AI交汇

深圳南山的AI产业链以硬件为底色,腾讯总部、华为研究院、商汤深圳研究院、创新奇智均在南山布局。深圳特有的电子制造业底盘(华强北、龙华、坂田)使AI设备(AI眼镜、AI手机核心元器件、AI边缘计算设备)的硬件产业链最为完整。

深圳的AI硬件工厂密集度全国最高,安克创新(300866,AI家电/出海)、出门问问(HK 2438,AI语音设备)等AI硬件公司亦深植深圳供应链。光通信设备制造商在深圳及周边的集聚度同样极高,为AI数据中心互联层提供本地化配套。

7.4.1 深圳AI制造业供应链的三层价值结构

深圳在AI产业链中扮演的角色,已经从传统意义上的"代工制造中心"转型为"AI硬件创新中心"。这一转型具有以下三层价值结构:

第一层:零部件供应。深圳拥有全球密度最高的电子元器件贸易与制造集散地(以华强北为代表)。电子元器件集成电路的采购效率比任何其他城市都高——一家AI眼镜创业公司可以在三天内采购到产品原型所需的全部零件,这是硅谷或北京无法实现的速度优势。

第二层:快速原型与小批量生产。深圳龙华、坂田、宝安的ODM/EMS工厂群,可以为AI硬件产品提供从样机到百台、千台、万台不同数量级的快速量产服务,且每个规模档次都有对应的工厂专业化承接。这使得深圳成为全球AI硬件创业公司做出"第一个可以给投资人看的实物原型"效率最高的地方。

第三层:大规模制造与全球交付。富士康(郑州+深圳)、比亚迪(深圳)、立讯精密(昆山+深圳)等超大型EMS企业,可以将AI设备的年产能扩张至千万台级别,并通过其全球物流和报关体系实现快速的跨境交付。这是中国AI硬件企业(安克创新、华为手机、小米等)能够在全球市场快速放量的根本依托。

三层结构的协同效应使深圳成为AI设备从概念到规模出海"全链路最短"的城市,也解释了为什么国际AI硬件公司(包括部分美国的AI眼镜创业公司)选择在深圳建立供应链合作关系而非其他地区。

7.5 苏州无锡:AI芯片制造与智算配套

苏州、无锡是长三角AI算力硬件制造的核心支撑区。华为海思(芯片设计)的制造委托方中有大量在苏锡常落地的封装测试厂;摩尔线程(GPU)的封测合作方亦在此区域。国内大量加速卡服务器关键零部件(散热材料、PCB、内存模组)在苏锡常生产。浸没液冷设备厂商、散热设备企业亦在苏州聚集。

苏锡常地区的AI制造业优势,是江苏省在2025年AI算力投资浪潮中崛起为重要产业极的关键支撑。具体看,有以下三个维度的竞争优势:

精密制造工艺积累:苏州工业园区和无锡高新区拥有全国最密集的精密制造企业群,包括半导体封测(ASAT、京隆、鸿海精密在苏州有大规模产能)、精密连接器(安费诺、泰科电子苏州工厂)、高性能PCB(华通电路、TTM科技苏州基地)等,为AI服务器关键零部件提供了高品质本地供应链。

液冷设备产业集聚:随着高密度AI服务器的散热需求爆发,苏州成为国内液冷设备冷板液冷设备厂商的主要聚集地之一。绿色冷却技术企业(英维克、西安新竹精密、超众科技苏州工厂)在国内数据中心液冷改造需求爆发的背景下迎来历史性增长窗口。

智算中心建设密度高:苏州工业园区、无锡市政府分别规划建设了多座地方智算中心,采购了大量国产AI算力(昇腾、寒武纪),为国产AI芯片提供了宝贵的实地验证平台,同时为周边AI制造业企业提供了近距离的技术展示和批量验证机会。

7.6 出海走廊:硅谷、巴黎与东南亚三线并进

中国AI模型出海在2025—2026年进入实质性商业化阶段,形成三条并行路径:

硅谷研发+美国ToB路线:DeepSeek、MiniMax、智谱均在旧金山湾区设立研发办公室,主要目标是吸引顶级AI研究人员,同时接触美国企业客户;但受美国AI安全审查影响,这条路线面临日益严格的政治摩擦。

欧洲开发者路线:Mistral所代表的欧洲开源社区与中国开源大模型(Qwen、DeepSeek)的生态高度兼容,中国开源模型在欧洲开发者中的下载量占比持续提升;欧盟AI Act推动欧洲企业优先选择合规供应商,给Mistral留出空间,但也为中国开源模型的欧洲部署提供了合规包装路径。

东南亚+中东商业化路线:DeepSeek-R1在东南亚开发者圈中一个月内占据35%的份额,MiniMax出海的主要收入来源之一是东南亚和中东的B2B客户;出门问问在日本、东南亚的AI语音设备市场已经具备规模。2026年预计东南亚和中东是中国AI产品出海最高速增长的两个市场。

2026年初,OpenRouter平台上全球模型调用量前五中,中国模型占四席(MiniMax M2.5、Kimi K2.5、GLM-5、DeepSeek V3.2),是中国大模型技术竞争力全球化的直接佐证。天下工厂平台覆盖的480万家真实在产工厂,其中涉及AI服务器GPU服务器光模块出口的供应商,正成为中国AI产业出海走廊的硬件底座。

7.6.1 出海监管迷宫:数据主权、安全审查与合规成本

中国AI应用出海面临的最大非技术障碍,是日益复杂的监管迷宫。这一迷宫由三层叠加构成:

第一层:数据主权与数据本地化要求。欧盟通用数据保护条例(GDPR)要求用户数据不得未经授权传输至欧盟境外;美国部分州的数据隐私法规对用户数据的处理和存储提出了具体要求;印度、越南、印尼等主要东南亚市场也在推进各自的数据本地化立法。中国AI应用要进入这些市场,必须在当地建立数据处理节点,增加了相当可观的基础设施投入。

第二层:AI专项监管。欧盟AI Act已于2025年落地,将AI系统按风险等级分类监管,高风险系统(如影响信贷、招聘、医疗决策的AI)需要通过严格的合规认证;美国联邦层面的AI监管立法虽仍在讨论中,但部分联邦机构(如FDA、FTC)已针对特定领域的AI应用发布了实施指引;部分国家对来自中国的AI产品还施加了额外的安全审查要求。

第三层:地缘政治与技术民族主义。2025年美国政府对多家中国AI企业实施出口管制,部分美国企业和政府机构开始将"供应链多元化"作为降低对中国AI技术依赖的采购政策。这一趋势短期内难以逆转,为中国AI企业直接进入美国企业市场制造了实质性障碍。

应对这三层障碍,中国AI企业的可行路径包括:将核心AI能力以开源方式发布(消除数据主权顾虑)、在目标市场建立合规本地化法人实体(满足本地化要求)、通过欧洲合作伙伴转包合规认证(借助当地品牌降低政治敏感性)、聚焦非受政治影响市场(东南亚、中东、非洲、拉美)。

八、细分专题深度解析

8.1 基础大模型:千亿参数之战进入超大规模MoE时代

2025年基础大模型的参数军备竞赛走向了一个悖论的结局:最强能力的模型(GPT-5、Claude Opus 4.7)总参数量估计超万亿,但对用户最实用的往往是百亿参数量级的高效模型。这一背景下,MoE架构(每次推理激活1/8—1/16的参数)成为兼顾能力与效率的最优解。DeepSeek V3的MoE设计(6850亿总参数、370亿激活参数)代表了当前能力/成本比的天花板。

参数量之外,上下文窗口长度的竞争同样激烈:Llama 4 Scout的1000万token上下文窗口能够"一口气"处理约7500本书,使超长文档分析、全代码库理解和会话历史全记忆成为现实。谷歌Gemini 1.5 Pro曾以200万token上下文窗口开创先例,2026年的主流旗舰模型已将百万token视为基本配置。

从基础模型的全球排名格局看,2025—2026年间出现了以下几个值得深究的结构性变化:

第一,中美能力差距大幅收窄,部分垂直领域中国模型领先。2023年GPT-4发布时,中国最强模型与之有明显差距;2025年以DeepSeek V3、Qwen3 72B、GLM-5为代表的中国开源模型在主流编程、数学和代码评测(HumanEval、MATH-500)上已与GPT-4o/Claude Sonnet旗鼓相当,在中文理解和中文指令遵循上甚至领先。这种差距的快速收窄,本质上是工程效率创新(DeepSeek的MoE路线)压缩了算力劣势的影响。

第二,评测基准的"军备竞赛"问题日益严峻。当模型厂商意识到MMLU、HumanEval等标准评测的得分是融资估值和市场营销的重要依据,会有动机对评测集进行过拟合(数据污染)。2025年多份学术研究显示,部分宣称"评测第一"的模型在真实用户任务上的表现远低于评测分数的暗示。为此,Chatbot Arena(人类盲测排名)和LiveBench(持续更新题目的动态基准)成为更可信赖的能力评估依据,并在2025年成为行业引用最广泛的两个第三方评测平台。

第三,基础模型能力趋同推动竞争下沉到应用层。当主流大模型的文本生成、代码生成、推理能力趋于相近时,用户选择的决策因子从"哪家模型能力最强"转向"哪家产品体验更好、数据更安全、价格更低、生态更完整"——这本质上是一场应用层的综合竞争,而不是模型能力的单一比拼。这一趋势对纯模型公司的估值逻辑形成了下行压力,推动他们加速向应用层延伸。

第四,模型生命周期大幅压缩。2022年一个顶级模型发布后可以保持18—24个月的领先地位;2025年主流评测排名的"轮换速度"是每季度一次,意味着模型公司必须保持持续迭代的能力,而不是依靠"一次大发布"吃老本。这种加速的内卷进一步提高了对持续算力投入和工程团队密度的要求。

8.2 推理模型:Chain-of-Thought+强化学习开创新范式

推理模型(Reasoning Model)是2025年AI技术格局最重要的新范式:通过让模型在"思考空间"中先生成解题过程(CoT),再给出答案,大幅提升数学、逻辑推理、代码调试等需要多步骤正确性的任务表现。OpenAI o1—o3—o4-mini路线、DeepSeek-R1、Google Gemini Deep Think、Claude 3.7 Sonnet"Extended Thinking"均属于这一路线。

推理模型的核心优势在于"硬难题"上的提升尤为显著(国际奥赛金牌级别),但代价是推理延迟更高(CoT消耗大量output token),对GPU服务器的推理算力密度要求更高——这直接推动了2025年推理侧算力投资的超预期增长。

推理模型的技术路径本质上是两种方法的结合:

基于过程奖励的强化学习(Process Reward Model, PRM):与传统RLHF仅对最终答案评分不同,PRM对推理的每一个中间步骤单独评分,鼓励模型产生"步步正确"的解题过程。DeepSeek-R1采用了结合GRPO(Group Relative Policy Optimization)的训练方法,通过多个候选解题路径的相对排名来更新策略,避免了传统PPO算法需要大量人工标注的依赖,极大地降低了训练成本。

蒙特卡洛树搜索(MCTS)型推理:OpenAI o3等模型在推理时采用类似棋类AI的树搜索策略,对每一个推理路径进行前瞻评估,选择最有可能得到正确答案的路径继续展开。这种方法在给定更多计算预算时可以持续改善答案质量,是"测试时计算扩展"的最直接实现形式。

从商业化角度看,推理模型的延迟与成本问题是制约大规模普及的关键瓶颈。以DeepSeek-R1为例,处理一道复杂数学题的推理token消耗可以达到普通对话的10—50倍,对应的推理成本同样倍增。为此,"混合推理模式"成为2025年的工程解决方案:系统自动判断问题复杂度,简单问题快速直答,复杂问题启用扩展推理模式。Claude 3.7 Sonnet、DeepSeek-R1-Zero等均实现了这种动态推理深度调整。

推理模型对制造业AI应用的开放窗口尤为值得关注:工厂采购决策、设备故障根因分析、工艺参数优化——这些场景的共同特点是"正确性比速度更重要",与推理模型的能力特征高度匹配。2026年制造业场景的Agent化,将以推理模型为大脑核心,以工具调用为执行手臂,形成真正意义上的"AI工程师"。

8.3 AI Agent:从演示到企业生产环境

Agent的核心能力栈包括四个模块:感知(接收文本、图像、代码、API返回值等多模态输入)、规划(将复杂目标拆解为子任务序列)、执行(调用浏览器、代码解释器、文件系统、第三方API等工具)和反思(评估执行结果并迭代修正)。2025年企业部署Agent的主要场景集中在软件开发(Code Agent)、数据分析(Data Agent)、客户服务(Service Agent)和知识管理(Knowledge Agent)。

典型案例:美的集团通过内部5000+员工Agent化,将研发和运营成本降低约40%,单季度可节省数亿元;OpenAI Operator上线后,超过1000家企业客户在30天内集成到其内部工作流;Claude Agent SDK支持多Agent协作(Orchestrator-Subagent架构),可以将一个复杂项目分配给多个专业子Agent并行处理。

深入解构企业Agent的落地障碍,有助于理解2025年为何52%的部署率并不意味着真正的"生产化成熟":

可靠性问题:Agent执行多步骤任务时,单步失败率虽低(如95%),但10步任务的整体成功率仅为0.95^10≈60%,20步任务成功率降至35%,50步任务成功率仅约8%。这意味着当前Agent在"无人监督完成复杂长流程任务"上仍然不可靠,需要"人在环路"(Human-in-the-loop)机制。2025年多数企业Agent部署的真实形态是"AI辅助+人工审核",而非纯自主执行。

安全与权限管控:Agent拥有执行代码、操作文件系统、调用外部API的能力,若不加限制可能产生越权风险(如误删关键数据、向外部发送敏感信息)。企业部署Agent时必须建立细粒度的权限沙箱(Sandbox)和动作审计日志,这对IT系统集成能力提出了较高要求。

幻觉传递风险:Agent在多步推理链中,早期步骤的幻觉错误会在后续步骤中被放大(误差传播)。解决方案包括:每步结果验证(执行前后对比)、关键操作人工确认节点、以及使用推理模型作为规划核心(减少幻觉率)。

工具生态与MCP标准化:Model Context Protocol(MCP)在2025年被广泛采纳,标准化了Agent与工具之间的交互接口。Anthropic作为MCP的提出方,Claude Agent生态已集成超过2000个MCP兼容工具;OpenAI Functions、Google Vertex AI Extensions也相继进行了兼容性适配。MCP的推广有望在2026年大幅降低企业将内部系统接入Agent的工程成本。

中国Agent市场的主要产品形态是"平台型Agent Builder":字节扣子(Coze)、百度ERNIE Agent平台、阿里钉钉AI助理均提供可视化的工作流配置界面,让不具备深度AI工程能力的业务人员也能自行搭建部门级Agent。2025年底,Coze平台上活跃的Agent数量超过100万个,其中约30%在企业内部场景实现了日均调用量超百次的生产级部署。

8.4 多模态视频生成:Sora效应与国产跟进

OpenAI Sora于2024年2月发布预览,引发视频生成AI的全球竞赛。2025年主要进展包括:Sora正式对ChatGPT付费用户开放,Google Veo 2、字节即梦AI、快手可灵、MiniMax Hailuo Video相继成为竞争主力。国内短视频生成产品的竞争格局以字节即梦AI(依托TikTok/抖音流量分发)和快手可灵(影视制作客户)为双核心,MiniMax Hailuo Video以出海获客为主。

视频生成AI在2025年尚处于商业化初期,主要营收来自创意工具订阅(月均30—100元)和影视后期服务(按项目收费),付费转化率整体仍低。2026年随着生成速度和一致性提升,广告创意、电商短片、教育内容制作有望形成稳定ToB付费。

视频生成AI的技术瓶颈与商业化路径,值得单独展开分析:

技术瓶颈:时序一致性与物理真实感。当前视频生成模型在生成10秒以内的短视频时,能够产出高质量的画面;但在生成30秒以上的长视频时,常见问题包括人物身份一致性丢失(人物面部、服装在帧间突变)、物理运动不合理(液体流动、物体落地效果违反物理规律)以及细节局部闪烁。这些问题的根源在于视频生成模型需要在时间维度上维持高度相关的帧序列,对计算资源和模型设计的要求远高于静态图像生成。

商业化路径一:广告与营销内容生产。品牌在数字营销上的视频内容需求爆发式增长,但专业广告制作的成本(一条30秒广告从拍摄到后期约10—100万元)使中小品牌望而却步。AI视频生成将"合格级"广告素材的成本压缩到千元乃至百元级别,这一价值主张对电商平台上的中小商家最为直接。国内即梦AI、可灵、Viva等产品已与淘宝、拼多多等电商平台进行联合产品集成,进入这一赛道的付费场景。

商业化路径二:影视与虚拟制作。长视频影视行业的AI应用分为两个层次:其一,后期制作辅助(AI特效、背景替换、色彩分级)——这是当前技术最成熟、商业化最早实现的环节;其二,AI主导的虚拟制作(AI角色、AI场景、AI运镜)——目前仍处于实验阶段,完全AI生成的长片正片质量尚不稳定。快手可灵在2025年为多部爱奇艺、优酷原创剧集提供了AI特效服务,商业合同已实现。

商业化路径三:短视频创作者工具。抖音、快手、小红书的内容创作生态中,AI视频工具正在成为创作者效率提升的核心辅助。即梦AI深度嵌入抖音创作工具链,用户可以在发布视频时直接调用AI拍摄、剪辑和特效功能,最终视频在抖音发布并通过流量变现——这形成了"AI工具→内容产出→平台流量→创作者收入"的完整闭环,也是字节视频AI在国内商业化最成功的落地形式。

从算力需求看,视频生成是AI应用中最消耗GPU服务器算力的场景之一:生成一段10秒的720P视频需要约30—50秒的A100 GPU时间,液冷服务器在视频生成集群中的比例因此显著高于文本生成集群。

8.5 AI金融与AI法律:专业场景率先变现

AI金融是国内大模型ToB应用最早形成ARR的场景之一:同花顺AI投顾月活超300万,东方财富AI辅助工具日均请求量超千万;量化投资领域的AI应用(基于大模型的因子挖掘和策略生成)已在私募基金中实现正式商业化部署。

AI法律的商业化路径更为清晰:合同审查(每份合同2—5分钟完成AI初审)、法律检索(基于RAG的案例匹配)和文书起草(模板+生成式补全)三类需求,对应律师事务所的高频痛点。国内元典法律、聆心智能已实现付费律所客户数过百,年人均节省工时估计超过200小时。

AI金融的商业化生态在2025年已形成明显的层次分化:

第一层:研究与分析辅助。这是AI金融渗透最快、阻力最小的子场景——帮助分析师更快地处理财报、研报和新闻,生成初稿分析报告,自动标记关键数据异常。主要产品形态是嵌入Bloomberg Terminal、Wind金融终端的AI助手插件,以及专用的金融研报AI写作工具。国内Wind资讯2025年推出Wind AI Assistant,在2000+家机构客户中的渗透率快速提升。

第二层:风险管理与合规。银行和保险公司将AI用于贷款审批辅助(基于企业数据的信用评估)、反欺诈检测(实时交易异常识别)和合规文本检查(监管报告自动化生成与审核)。这一场景受监管约束最严格,但一旦通过银行内部安全评估,商业价值极高——单家大型商业银行的AI风控年合同额可达数亿元。第四范式(HK 6682)的Sage AIOS在银行风控领域的私有化部署是国内最成熟的商业案例之一。

第三层:量化交易与投资决策。量化私募基金(幻方科技、宽德投资、鸣石投资等)是AI技术最深度的金融用户——他们使用AI进行因子挖掘、策略回测和信号生成。但这一场景对监管透明度要求极高,金融机构难以采购外部AI模型直接用于投资决策(监管合规风险),因此大型基金倾向于自研AI能力,外部厂商的市场实际上局限于工具链和数据供应。

AI法律在中国的商业化还面临一个独特的结构性障碍:中国法律事务所体量分散(绝大多数是10人以下的小所),付费能力和付费意愿均有限,而大型律所(金杜、中伦等)在AI采购上偏向自研或定制,公开市场付费对外部AI法律工具厂商并不友好。真正的大量级商业化机会,在于司法系统内部(法院AI辅助裁判、检察院AI辅助审查)——这属于政府采购逻辑,而非市场化逻辑,科大讯飞星火和华为盘古政务AI在此赛道布局最深。

8.5.1 AI医疗:从影像识别到临床决策支持的演进路径

AI医疗是中国垂直大模型应用中规模最大、监管最复杂的赛道。按应用层次,可以划分为三个演进阶段:

阶段一:影像辅助识别(2020—2024年)。这是AI医疗最早商业化的子领域:肺结节CT识别、眼底图像糖尿病视网膜病变检测、皮肤病图像分类。联影医疗(688271)、推想科技、视见科技等公司已在国内大型三甲医院实现规模化商业部署。这类产品的核心能力是计算机视觉(CV),与大语言模型的关联相对间接——准确地说属于深度学习的传统应用,而非生成式AI的新浪潮。

阶段二:临床辅助决策(2024—2026年)。大语言模型进入医疗场景的核心切入点是"电子病历+临床指南+诊断建议"的闭环:基于患者病历、检验结果和影像报告,AI生成鉴别诊断清单和治疗方案建议,供医生参考。百川医疗大模型(百川智能旗下)、讯飞医疗助手(科大讯飞)在基层医院的首诊辅助场景已进行规模化试点。国家卫健委于2025年发布AI医疗产品监管指引,要求"高风险辅助决策类"产品必须取得三类医疗器械注册证(流程约需2—3年),为全面商业化构建了监管屏障。

阶段三:药物研发加速(2025年以后)。AI大模型在蛋白质结构预测(AlphaFold 3之后)、分子生成、药物虚拟筛选方面已经显示出重构药物研发流程的潜力。国内晶泰科技(已港股上市)、英矽智能(深圳,港股上市在途)在AI辅助药物设计上取得阶段性成果;外资巨头(辉瑞、诺和诺德)也在向国内AI药物研发团队采购技术服务。这一赛道的商业化周期最长(药物从候选分子到上市约10年),但市场空间以千亿美元计。

8.6 AI出海:从技术输出到商业化变现

2025年中国AI出海进入第二阶段:第一阶段(2023—2024年)以开源影响力为主;第二阶段(2025—2026年)开始出现直接的ToB商业化变现。MiniMax出海收入占比超70%是最强信号,Kimi K2.5的全球API用户付费为另一证据。

中国AI模型的出海竞争优势包括:成本效益(DeepSeek类推理成本仅为同级别美国模型的1/5—1/10)、开源可控(私有化部署可规避数据主权问题)、多语言支持(Qwen3覆盖百种语言,科大讯飞在拉美/东盟重点语种上性能领先)。限制因素主要是地缘政治(美国审查、欧盟AI Act合规)和品牌认知(中国AI品牌在欧美企业端可信度仍低于OpenAI/Anthropic)。

8.7 工业AI:制造业数字化的最大潜力板块

工业AI是中国AI大模型应用中市场规模最被低估、商业化难度最高的赛道。制造业占中国GDP约27%,是GDP最大的单一贡献行业;但AI对制造业的真实渗透率(以实现显著量产效率提升或质量改善为标准)在2025年底仍仅约12%,显著低于零售(约30%)和金融(约35%)。

工业AI的低渗透率有其深层结构原因:

原因一:工业数据的碎片化与非标准化。工厂设备由来自数十个不同厂商的设备组成,每台设备的数据格式、通信协议各不相同(MODBUS、OPC-UA、私有协议共存),要实现工厂级别的AI应用,首先必须完成数据采集、清洗和标准化,这往往需要投入与AI本身相当的工程资源。许多工厂的数据采集基础设施(传感器、PLC、SCADA系统)本身也不完善,从零补建的成本使AI项目的整体ROI显得不那么"立竿见影"。

原因二:决策人员的技术鸿沟。中国制造业工厂的管理者以传统工程技术背景为主,对"大模型能做什么"的认知普遍停留在"聊天机器人"阶段,对AI能够赋能质检、排产、设备预测性维护等核心场景的理解不足。这使得AI项目的内部推动力不足,往往需要外部咨询公司或行业大模型厂商投入大量前期教育成本,才能推进到POC(概念验证)阶段。

原因三:安全与可靠性的极高标准。工厂生产环境的容错率几乎为零——一次AI误判导致的设备故障,损失可能高达数百万元。因此,企业对工业AI的安全验证周期极长(通常6—18个月的试点后才规模化),且倾向于优先选择在同行业有成熟案例的供应商,这对新入局的AI公司构成了显著的准入壁垒。

尽管渗透率仍低,工业AI已经在以下四个子场景形成了可复制的商业模式:

质量检测视觉AI:用摄像头+视觉大模型替代人工目检,在PCB板焊点检测、纺织品瑕疵检测、汽车冲压件表面检查等场景已实现98%+的检测精度,且单次投入后边际成本极低。创新奇智(HK 2121)、微目视(深圳)等公司已实现年营收过亿元的规模化商业落地。

设备预测性维护:通过振动传感器、温度传感器、电流传感器数据,结合AI模型预测设备故障,实现"计划性停机"代替"故障停机",将非计划停机率降低30—50%。这一场景的商业价值对重型设备(数控机床、注塑机、风力发电机组)尤为突出。西门子、三菱电机等工业巨头与国内天云数据、数睿数据等AI公司在这一场景有成熟合作案例。

排产与供应链优化:基于订单需求预测、原材料库存水位和机器产能约束,AI生成最优排产方案,替代传统的人工Excel排产。这一场景对GPU服务器的算力依赖相对较低(以运筹学优化算法为主,AI辅助预测),但对数据集成平台要求较高。

能耗管理与碳排优化:在"双碳"政策驱动下,工厂能耗管理成为刚需——尤其是高能耗行业(钢铁、化工、有色金属)需要每年向主管部门报告能耗和碳排放数据,AI系统实时监控和优化能耗分配,可以在不降低产能的前提下节电10—20%,并自动生成合规报告。

8.8 AI教育:消费AI变现效率最高的垂直赛道

AI教育是中国ToC大模型应用中付费转化率最高的细分场景,核心逻辑是:中国家长对孩子教育的付费意愿远高于其他消费场景(年均教育支出占家庭收入的比例在部分省份超过20%),AI家教产品的定价空间因此显著高于其他AI订阅服务。

科大讯飞学习机(AI+英语口语/数学辅导)在2025年收入大幅增长,单价3000—7000元的AI学习机在小学到高中阶段渗透迅猛;网易有道旗下的"子曰"AI英语口语教练,月活用户付费率约15%,是国内AI ToC产品中付费率最高的之一;字节旗下的教育AI产品(悟空口算、有辅导)在K12场景的AI集成同样迅速推进。

AI教育的商业逻辑得益于两大结构性优势:其一,教育效果的可量化性使付费决策更加理性(孩子的英语口语成绩提升是可见可测的,比"AI写作助手"的价值更容易说服家长);其二,学生用户的学习行为产生的数据飞轮(练习记录→错误模式→个性化推荐)使AI教育产品能够比其他AI应用更有效地建立用户粘性和护城河。

海外市场方面,科大讯飞在拉美和东盟的AI英语学习产品(2025年海外营收超10亿元)是中国AI教育出海的最成熟案例。

九、技术演进深度解析

9.1 MoE混合专家架构的工程化突破

混合专家(MoE,Mixture of Experts)架构已从学术概念演变为主流大模型的工程标配。其核心思想是:将前馈网络替换为N个专家子网络,每个token由Router动态选择激活K个专家(通常K=2—8,N=16—256),实现"用更少的计算量服务更多的参数"。DeepSeek V3(37B激活参数/685B总参数,激活率约5.4%)、Mixtral 8x22B(390B总参数)、GPT-4(推测为MoE架构)均为代表作。

MoE的工程挑战在于:专家负载均衡(避免某些专家被过度使用而其他专家"失业")、训练不稳定性(Token dropping导致梯度消失)、推理侧的专家并行(需要高带宽互联,与GPU服务器的NVLink/InfiniBand网络密度直接相关)。DeepSeek在上述三个工程难点上均取得突破,才实现了560万美元训练成本的历史性低点。

DeepSeek MoE架构的工程创新详解,对理解中国AI工程效率领先的来源至关重要:

创新一:细粒度专家分组(Fine-grained Expert Segmentation)。传统MoE将前馈层分为K个整体专家;DeepSeek将每个专家进一步细分为若干"子专家",提高专家多样性,减少"专家坍塌"(所有token都倾向于激活同一批专家)的风险。这一设计使路由器能够进行更精细的能力分配,提高了整体模型的参数利用率。

创新二:辅助损失的重平衡设计。为避免专家负载不均,需要引入"平衡损失"(Auxiliary Loss)惩罚负载偏斜。DeepSeek设计了一种自适应平衡机制,在训练初期对负载均衡施加更强约束(防止部分专家"被淘汰"),训练后期逐渐放松约束(允许模型自然形成专家专业化分工),兼顾了训练稳定性和最终模型的能力分化。

创新三:FP8混合精度训练。DeepSeek-V3采用FP8(8位浮点数)精度进行大部分矩阵运算(传统大模型训练使用BF16/FP16,即16位),在不显著损失精度的前提下将显存占用和通信量减半,允许在相同显存下处理更大的批次(Batch Size),进一步提升了训练效率。这一技术在2025年前被认为在大规模训练中难以稳定实施,DeepSeek的成功验证了FP8训练在万亿参数级别MoE模型上的可行性。

创新四:多头潜在注意力(MLA,Multi-head Latent Attention)。标准Transformer的注意力机制需要存储大量的KV Cache(每个token的键值向量),在长上下文推理时显存消耗巨大。MLA将KV Cache压缩为低秩潜在向量(类似于低秩矩阵分解),显著降低推理时的显存需求,使相同显存下可处理的上下文长度提升约5倍,这对依赖长文档处理的企业AI场景极为重要。

以上四项创新的协同,是DeepSeek能够以远低于竞争对手成本训练出具有竞争力大模型的根本技术原因,也是"工程效率派"在算力约束条件下的创新范本。

9.2 推理时计算扩展(Test-Time Compute)

2025年另一重要技术方向是"推理时计算扩展"(Test-Time Compute Scaling):通过在推理阶段投入更多算力(更长的CoT、更多并行采样、迭代自我修正),提升最终答案质量——即便不更新模型权重也能持续改善性能。OpenAI o3在国际数学奥赛(AIME)上的得分随Token预算指数级提升,是这一现象的直观证据。

推理时计算扩展对算力需求的影响是非线性的:能力提升10%,算力消耗可能增长3—5倍。这一特性推动企业采购更高单卡性能的AI芯片和更大带宽的网络交换机,是2025年推理算力投资远超预期的技术根因。

测试时计算扩展的四种具体实现形式,在2025年的工业实践中已形成清晰的差异化分工:

Best-of-N采样:生成N个独立候选答案(通常N=4—16),选择其中最佳的(用验证器或投票机制选择)。这是最简单的测试时扩展方法,对代码生成(程序正确性可以用单元测试验证)效果尤为突出——GitHub Copilot的"Accept Suggestion"准确率从50%(单次采样)提升到75%(Best-of-8采样),算力消耗提高7.5倍,但效果边际递增。

顺序修正(Sequential Refinement):模型生成初始答案后,用验证器检查错误,将错误反馈给模型并要求修正,循环迭代3—5次。这一方法在数学证明(可以用计算验证证明步骤的有效性)和代码调试上效果最佳,OpenAI的Operator服务已在长任务执行中采用类似的自我修正循环。

Beam Search增强:在推理路径上同时维护K条候选路径(而非单一路径),在每一步选择概率最高的分支继续展开,最终选择累计分数最高的路径。这一方法源自传统NLP的解码策略,被重新引入推理模型的CoT生成过程,在数学推理的复杂计算步骤中效果显著。

外部验证器增强(Verifier-Augmented Generation):将大模型与外部工具(Python解释器、数学引擎、知识图谱查询)结合,让模型在推理过程中主动调用外部工具验证中间结果,并根据验证结果调整后续推理方向。这一方法最接近"真实的科研工作流",在专业场景(化学合成路线设计、金融建模)中显示出超越纯语言模型的性能上限。

9.3 RAG、微调与知识管理工程

企业AI落地的技术路径是"基础模型+领域数据+工程化接口"三层叠加。RAG(检索增强生成)通过向量数据库实时检索外部知识,解决模型知识截止日期和私域数据不可见的问题;Fine-tuning(参数微调)通过LoRA/QLoRA等高效方法将领域知识烧入模型权重,适合频繁重复的特定任务;两者在企业场景中往往结合使用(先检索后生成,微调控制输出风格)。

2025年企业RAG采用率达75%,支持RAG的向量数据库产品(Milvus国内领先)和知识库中间件成为增长最快的AI基础设施细分赛道,存储设备的NVMe SSD需求受此推动持续增长。

RAG的工程实现在2025年发生了显著的范式升级,从"基础RAG"向"高级RAG"(Advanced RAG)演进:

基础RAG的局限性:将文档切分为固定长度的段落(chunk),每次检索top-K个最相似段落后拼接给模型。这种方式的主要问题是:切分粒度不当(将一个完整论点切断)、检索不精准(语义相似但语义不相关的段落被错误召回)、对话多轮追问时无法记忆上下文。

高级RAG的改进方向:查询改写(Query Rewriting,先让模型将用户问题改写为更精确的检索词)、假设文档嵌入(Hypothetical Document Embeddings, HyDE,生成假想的"理想答案"再用其向量检索)、图谱增强检索(Knowledge Graph RAG,引入实体关系图谱提升复杂问题的推理深度)、多路召回融合(同时使用BM25稀疏检索+向量密集检索,取两者的并集后重排)。

微调工程的最新进展:参数高效微调(Parameter-Efficient Fine-Tuning, PEFT)方法在2025年进一步成熟,LoRA(Low-Rank Adaptation)已成为企业私有化微调的事实标准;QLoRA在此基础上进一步将可训练参数量压缩至原始模型的约0.1%,使在消费级GPU(单卡A10/RTX 4090)上微调700亿参数模型成为现实,大幅降低了中小企业自行微调的算力门槛。

9.4 安全对齐:RLHF、Constitutional AI与超对齐

2025年模型安全对齐已从"辅助工程"升级为"核心竞争力"。OpenAI、Anthropic、DeepMind均有专门的超对齐(Superalignment)研究团队,致力于在模型能力持续增强的同时确保模型行为可预测、可控制。Anthropic的Constitutional AI方法通过让模型自我评估输出是否违反一组原则(无需大量人工标注),是目前工业界落地最广泛的对齐方法之一。

中国的安全对齐工作在政府推动下进展显著:国家标准要求备案模型必须通过多维度安全测试,包括有害内容过滤准确率、个人信息保护合规率等量化指标,形成可测可评的安全质量基线。

超对齐的核心议题是:如果AI模型的能力超越人类(超级智能),人类如何确保其行为依然对人类有利?OpenAI超对齐团队(2023年成立后经历了联合创始人Ilya Sutskever和Jan Leike的离职风波)在2025年重整并专注于"可解释性"(Interpretability)研究——即理解模型内部的"思维过程",识别潜在的误对准信号。Anthropic则通过大量的"红队测试"(Red Teaming,人工构造边缘场景来测试模型的安全边界)积累了业界最系统的模型安全数据集,并将这些数据用于指导下一代模型的训练。

对于中国AI产业而言,安全对齐除了模型技术维度,还有政策合规维度:备案制度要求模型在安全评估通过后才能面向公众开放,这实际上为通过评估的大厂提供了一定程度的市场准入壁垒(阻止了大量未备案的境外产品和未通过安全测试的国内小模型进入正规商业渠道)。从竞争格局看,备案制有利于资源充裕、合规能力强的大型平台(百度、阿里、腾讯、字节),对创业公司构成了一定的合规门槛。

9.5 端侧模型与量化技术

端侧大模型的核心工程挑战是:如何在内存(LPDDR5X/LPDDR5T,约16—32GB)和算力(手机NPU,约40—60 TOPS)极为有限的终端设备上运行能力"足够好"的大模型。2025年的主流方案是:INT4/AWQ量化(将权重从FP16压缩至4比特,体积缩小4倍,性能损失约5%)+KV Cache优化+分层卸载(部分层卸载到CPU/存储)。苹果MLX框架、高通QNN(Qualcomm Neural Network)、联发科APU SDK是目前端侧推理最成熟的三套框架。

端侧模型的商业价值在于:离线可用(无需联网)、隐私保护(数据不上传)、延迟极低(本地推理<100ms),最适合个人助手、输入法、实时翻译、本地知识库等高频低延迟场景。

端侧量化技术的最新进展在2025年实现了两个重要突破:

突破一:FP4精度推理在端侧的工程化。传统的端侧推理主要使用INT4(4位整数量化),但整数量化存在精度损失较大、在某些数值分布不均匀的模型层上表现不稳定的问题。FP4(4位浮点数量化)在保持近似存储成本的同时,能更好地保留数值精度,在复杂推理任务上的性能损失更低。英伟达Blackwell系列GPU在服务器端率先支持FP4推理,而苹果A18 Pro的Neural Engine在2025年通过硬件原生支持将FP4推理带入端侧,使7B参数模型在iPhone上的推理速度提升约40%。

突破二:动态量化与混合精度推理。不同于传统的"全层统一量化",动态量化根据模型不同层的数值分布特征,对敏感层(如注意力权重矩阵)使用更高精度(INT8或FP8),对不敏感层使用更低精度(INT4甚至INT3),在整体压缩率相同的情况下将推理精度损失降低约30%—50%。这一方法在2025年随着llama.cpp、MLC-LLM等开源推理框架的成熟,已经可以通过简单配置实现,大幅降低了端侧大模型优化的工程门槛。

量化技术的进步对AI芯片设计产生了反向影响:芯片设计师现在必须在硬件层面提供对INT4/FP4的原生加速支持(而非依赖软件模拟),否则会在实际推理效率上被竞争对手的芯片拉开差距。这一趋势推动了AI芯片设计的快速迭代,相关的集成电路封装测试需求同步增长。

9.5.1 端云协同推理:分布式AI系统的新范式

端侧AI与云端AI的协同,在2025年发展出了超越简单"本地/云端二选一"的更复杂调度范式。真正的端云协同系统需要在以下多个维度做实时决策:

决策维度一:本地能力判断。系统首先评估当前请求是否在本地模型的能力范围内——简单的日程提醒、本地知识问答、基础语音识别直接在端侧执行,保证<100ms的响应速度;复杂的长文档分析、需要实时联网知识的问题、需要生成高质量图像的请求,则路由至云端模型。这一判断在用户无感知的情况下完成,实现了"快速问题即时响应、复杂问题准确作答"的体验统一。

决策维度二:隐私等级判断。用户的医疗健康数据、财务信息、私密对话——这些高度敏感的内容应当严格在端侧处理,禁止上传至任何服务器(包括设备制造商的服务器)。Apple Intelligence的Private Cloud Compute就是为这类高隐私需求设计的:当请求需要更强的云端算力时,数据在发送前经过加密,云端服务器处理完后立即删除,整个过程苹果自己也无法查看。这一架构通过可审计的技术手段(非单纯的隐私承诺)实现了用户数据的隐私保护,是端云协同隐私保护的工程范本。

决策维度三:网络状态自适应。网络连接不稳定时(地铁隧道、飞机上、网络繁忙时段),系统自动切换至端侧模式,在能力受限的条件下保持基础可用性,而非显示错误页面或冻结响应。这种"优雅降级"的设计哲学是真正的消费者体验思维,而非工程师思维。

9.5.1 端侧推理生态的竞争格局与苹果优势

苹果在端侧AI推理生态的竞争中占据了结构性优势,但这种优势并不来自芯片算力的绝对领先,而来自软件-硬件-服务的垂直整合深度:

Apple Intelligence(苹果AI功能体系)将云端大模型推理(通过Private Cloud Compute隐私计算服务器,运行苹果自研大模型)与端侧推理(A18/A17 Pro芯片的Neural Engine)无缝融合,并在用户无感知的情况下动态选择最优的推理位置。这种"按需上云"的端云协同模式解决了端侧算力有限的核心矛盾,同时通过私有计算服务器(Private Cloud Compute)架构确保了数据不离开苹果的安全基础设施,规避了中国用户的数据主权顾虑。

苹果模式的可复制性是一个关键问题。华为(Mate系列+盘古AI)、小米(14 Ultra+Hyper AI)、OPPO(Find X8+AndesGPT)均采用了类似的"端云协同AI"思路,但在以下三个维度存在差距:其一,芯片软件栈的成熟度——苹果的CoreML/ANE工具链有超过10年的积累,国内手机厂商的NPU开发工具链成熟度差距明显;其二,生态应用的适配深度——苹果通过API要求所有App开发者适配Apple Intelligence接口,确保了AI功能在第三方应用中的一致体验;其三,系统级优化的连贯性——端侧模型在操作系统层面的内存管理和任务调度优化,需要操作系统开发团队和AI团队的紧密协作,苹果作为垂直整合平台天然具备这一优势。

对于中国AI硬件厂商而言,2026年最重要的战略抉择是:是深度绑定特定大模型厂商(华为手机绑定盘古/文心、小米绑定MiniMax/豆包),还是构建开放的端侧AI API市场(让多家大模型厂商竞争接入)。前者在短期内能够形成差异化体验,后者长期来看有助于扩大开发者生态,但需要克服生态碎片化的问题。这一战略选择的影响将在2027—2028年随着AI设备渗透率突破50%而充分显现——届时消费者在购机时将把"搭配哪家AI"作为与"摄像头画质"同等重要的考量指标,先完成生态锁定的厂商将在用户续购和高端型号溢价上形成显著优势。

十、风险分析

10.1 美国制裁与国产算力天花板

美国对华AI芯片出口管制是悬在中国AI大模型产业头顶的最大结构性风险。H100/A100早已禁止出口,H20在2025年4月再次被叫停(7月恢复),显示出管制范围随技术进步动态调整的特点。现有合规渠道仅剩H20(FP16算力220TFLOPS,约为H100的22%),对大规模训练集群的算力上限构成显著限制。

国产替代的进展喜忧参半:寒武纪MLU570、华为昇腾910C在FP16算力上接近H100的60—80%,但软件生态(CUDA兼容性、框架支持、算子优化)与英伟达仍有1—2年的差距。2025年国产AI加速卡中国市场份额达41%,出货量约164万张,是真正意义上的量的突破;但质的突破(超越H100等效能力)预计需要到2026—2027年才能实现。

深入分析芯片制裁的长期影响,可以识别出三个容易被忽视的传导路径:

传导路径一:算力等效能力的隐形天花板。即便国产芯片的峰值算力接近H100,实际训练效率(MFU,模型浮点利用率)往往因软件栈成熟度不足而大打折扣。以华为昇腾910B为例,在同一Transformer模型上的实际训练吞吐量约为H100的60—70%(理论算力的80%,但软件优化效率约75%),意味着在相同训练时间内,中国国产GPU集群的等效算力规模约为相同卡数英伟达集群的60%。这一差距随着集群规模扩大可能进一步放大(集合通信效率随规模扩大衰减更快)。

传导路径二:工程师生态的竞争力影响。全球顶级AI研究工程师的招募偏好,在一定程度上受到工具链成熟度的影响——如果一家中国AI公司的研发集群以昇腾为主,而候选人在学校和研究院的项目都在英伟达CUDA生态完成,那么迁移学习曲线成为一个实质性的招募摩擦因素。这一效应在2025年已有公司在招募高端AI研究人员时遭遇的案例中有所体现。

传导路径三:对开源生态的地缘分裂影响。美国对华AI芯片管制叠加出口管制,将推动开源AI生态逐渐出现"美国体系/英伟达CUDA生态"与"中国体系/昇腾+寒武纪生态"的分化。未来中国开源模型(Qwen、DeepSeek)可能会针对国产算力平台提供专项优化版本(类似于PyTorch对Apple MPS的专项优化),但这也意味着中美开源生态的互通性在未来数年内将逐步下降。

对于AI大模型用户(企业和开发者)而言,2025年的合理策略是:在推理侧积极采用国产算力(成本已具竞争力,推理工作负载对软件生态完整度要求低于训练);在训练侧保持对英伟达GPU和国产GPU的双技术栈兼容,避免单一绑定,待国产GPU软件生态成熟后再逐步迁移。

10.2 商业化闭环与ARR瓶颈

大模型商业化面临一个结构性挑战:训练成本虽已大幅下降,但ToC用户的付费意愿仍然偏低,ToB客户的采购周期偏长(大型企业6—12个月),导致整体ARR增长慢于融资估值的隐含预期。2025年中国所有大模型创业公司的合计ARR估计不超过200亿元,而整体融资体量已超过500亿元,投入产出比仍处于"种播期"。

变现最快的三个场景——编程辅助、AI办公、AI学习机——均依赖用户较强的付费习惯;而AI客服、AI销售等降本场景的买单方是企业而非个人,采购决策周期更长、但单客价值更高,是2026—2027年ARR增长的主要来源。

AI商业化的漏斗模型在2025年表现出清晰的"三阶段衰减":

第一阶段衰减:从注册到首次付费。大模型产品的免费注册用户基数庞大(Kimi峰值月活超3000万,豆包月活逾1亿),但首月付费转化率普遍不超过3—5%。原因在于:大模型的核心价值主张("帮你更高效地完成思考和写作")对于非重度用户而言感知模糊,免费额度足以满足轻量使用,没有明确触发付费意愿的"必须付费"时刻。相比之下,Notion AI的付费转化率超过15%,核心原因是其嵌入在具体工作场景(文档编辑、项目管理)中,付费价值对用户显而易见。

第二阶段衰减:从首次付费到持续订阅。转化为付费用户后,次月留存率是商业健康度的核心指标。行业普遍数据显示,AI对话类产品的次月付费留存率约60—70%(低于工具类软件80%以上的基准),主要原因是用户对"每月花费XX元使用AI"的价值感知不稳定,在"没什么需要问AI"的月份会选择退订。将AI能力深度嵌入日常工具(WPS AI嵌入金山文档、Claude Code嵌入代码编辑器)的产品,留存率显著更高。

第三阶段衰减:从ToC到ToB的转型难度。许多大模型创业公司在ToC方向遭遇变现瓶颈后,尝试转型ToB,但发现ToB销售的商业逻辑与ToC完全不同:需要专业销售团队、企业定制需求响应能力、数据安全私有化部署能力、以及足够长的签单周期内的财务储备。2025年国内多家初期以ToC为主的大模型公司开始承受"ToC流量烧钱、ToB转型缓慢"的双重压力,预计2026年将出现部分公司的战略收缩或合并。

10.3 模型同质化与技术护城河

开源浪潮使基础模型的差异化越来越难维持。Qwen3、Llama 4、DeepSeek V3均以MIT/Apache开源,任何人都可以免费获取、部署、微调,这使以"模型能力领先"为单一护城河的商业模式日益脆弱。真正可持续的护城河转向:数据飞轮(用户使用数据持续改善模型)、场景深度(垂直行业数据+流程集成)、应用生态(开发者生态规模和粘性)、算力自有(自建训练集群降低边际成本)。

从投资视角分析这一趋势,有几点值得警惕:

估值逻辑的重构:2023—2024年,大模型公司的一级市场估值主要锚定于"技术差距乘数"——模型能力越接近GPT-4,估值溢价越高。进入2025年后,随着开源模型能力趋同,估值逻辑开始向"可持续商业模式"和"ARR成长性"迁移,估值倍数显著压缩。部分曾以100亿美元估值融资的中国大模型公司,在2025年新一轮融资中面临估值持平甚至下调的压力。

"中台化"的陷阱:部分大模型公司试图将自己定位为"AI中台"——向企业提供通用的AI能力平台,客户可以在上面构建自己的AI应用。这一定位听起来有"平台性",但实际上面临来自上下游的双重挤压:上游,阿里云百炼、百度千帆、华为ModelArts等云厂商提供的MaaS平台已经具备类似功能,且依托云资源绑定优势定价更低;下游,真正有足够规模和预算的大型企业客户,更倾向于直接与基础模型厂商(百度、阿里)合作,或自建AI团队,而不是依赖中间层平台。独立AI中台公司的生存空间正在快速收窄。

护城河的可持续性测试:真正能在未来5年持续保持竞争优势的AI公司,满足以下其中至少两个条件:①拥有独特且难以复制的私有数据资产(特定行业标注数据、用户行为数据飞轮);②嵌入用户的核心工作流(替换成本高,用户迁移阻力大);③具备一体化的算力-模型-应用垂直整合能力(降低边际成本,建立规模壁垒);④占据特定行业的标准化制高点(成为某一场景的事实标准,如科大讯飞在政府语音识别领域的地位)。

10.4 AI幻觉与版权风险

大模型"幻觉"(Hallucination,模型以高置信度输出错误信息)在专业场景(医疗诊断、法律判决、金融投资)中风险尤为突出,是制约ToB高价值场景渗透的技术瓶颈。RAG与推理模型的结合可以显著降低幻觉率(从约15%降至约3—5%),但无法完全消除,意味着高风险专业场景仍需"人在环路"。

版权风险方面,中国最高人民法院在2025年就AI生成内容的著作权归属问题作出多份指导意见,确立了"AI工具辅助+人类实质性创作=可著作权"的基本框架;但训练数据中包含版权内容的合规性问题仍悬而未决,未来可能产生类似美国创作者集体诉讼的法律风险。

幻觉问题的缓解技术在2025年取得了多项进展,但"完全消除幻觉"仍是未解之题:

自我一致性检测(Self-Consistency):对同一问题生成多个独立答案,取一致性最高的答案作为最终输出。这种方法在推理类任务上效果显著,但显著增加推理成本(需要3—10倍的计算量)。

引用验证(Citation Verification):要求模型在每个关键事实主张后附上信息来源(URL或文档段落),并程序化验证引用的真实性和准确性。Perplexity AI的"引用先行"设计是这一方法的最成熟实践,每条回答都显示引用来源并标注具体段落,使用户可以快速验证信息真实性。

不确定性量化(Uncertainty Quantification):让模型输出置信度估计("这个答案我有85%的把握是正确的"),使用户可以根据置信度决定是否进一步核实。这一方法在研究层面已取得进展,但工业化落地仍面临校准(Calibration)准确性的挑战。

版权问题的复杂性在于,AI训练语料的"合理使用"边界在不同法律体系下有完全不同的解释:美国联邦法院在2025年的多份判决中对"合理使用"作出了有利于AI公司的宽泛解释(将AI训练类比为图书馆的版权豁免),而欧盟AI Act要求生成式AI服务商公开披露训练数据的来源,并为版权持有人提供退出机制。中国在这一问题上的法律框架仍在形成中,2025年多起涉及AI生成内容版权的案件正在进行中,预计2026年将出现具有标杆意义的司法判决。

对于企业用户而言,规避版权风险的实用策略是:使用私有数据进行垂直微调(而非直接使用含版权内容的训练数据);在输出物中注明"AI辅助创作"而非"AI独立创作";在高价值内容(广告文案、出版物)发布前进行人工实质性修改,确保满足"人类实质性创作"的著作权要件。

10.5 算力成本与能源约束

单次GPT-4级推理的电力消耗约为传统搜索的7—10倍,随着AI应用渗透率提升,数据中心电力需求呈指数上升。中国已出现部分地区数据中心用电指标紧张、新建项目审批延迟的情况,绿色算力(水电、风电、光伏直供数据中心)成为新建智算中心的必要条件之一。数据中心节能技术(PUE优化、液冷节能)正在成为智算中心建设的核心技术指标。

量化分析AI算力的能耗成本,有助于理解AI商业模式的长期可持续性:以GPT-4级推理为基准,每100万个输出token约消耗0.5—1度电,对应电费约0.3—0.5元(中国工业电价约0.5—0.8元/度);主流大模型API的每百万token收费约1—20元,意味着电费约占推理成本的5—20%。在当前定价下,电费是可以承受的;但若AI推理量级从2025年的每天数万亿token增长至2028年的每天数百万亿token,电力需求将成为行业增长的真实约束。

中国绿色算力的政策导向明确:国家发改委2025年发布的《智算中心建设指引》要求新建大型智算中心的PUE(电力使用效率)不超过1.25,并优先在西部地区(内蒙古、甘肃、贵州——"东数西算"工程的延伸)利用可再生能源(西部丰富的风光水资源)为AI训练集群供电。阿里云、腾讯云、百度云的新建算力节点均已将内蒙古、乌兰察布、贵州贵安列为重点布局区域,这些地区的机房建设配电柜等工业供应链需求随之快速增长。

液冷技术在高密度AI服务器部署中的必要性已成共识:英伟达H100/B200的热密度(TDP约700W—1000W/卡)已超出传统风冷数据中心(机柜功率密度通常约15—20kW)的散热能力上限;液冷方案(冷板式液冷功率密度可达100kW/机柜,浸没液冷可达200kW/机柜以上)是高密度AI集群的技术必选项,而非可选项。国内浸没液冷冷板液冷设备厂商因此迎来长期高速增长窗口。

10.6 开源与闭源的博弈:商业模式的根本分歧

开源与闭源之间的博弈,是2025年AI产业最深层的商业模式辩论,也是中美AI竞争在商业逻辑层面的核心分歧。

闭源阵营的逻辑(OpenAI、Anthropic为代表):最强能力只对付费用户开放,形成可持续的订阅收入;模型权重不公开,竞争对手无法直接复制能力;用户黏性来自产品集成体验,而非技术本身的不可获取性。核心假设是:卓越能力本身就是护城河,用户愿意为"最好的"持续付费。

开源阵营的逻辑(Meta Llama、阿里Qwen、DeepSeek为代表):开源最强权重以换取生态规模——全球数百万开发者基于开源模型构建应用,为平台带来无法用广告费购买的品牌认可和生态影响力;在此基础上,通过云服务、企业定制部署、硬件销售实现间接商业化。核心假设是:生态规模本身就是护城河,标准化之后的盈利方式不依赖于模型访问费。

2025年的市场表现部分验证了这两种逻辑的共存可能性:OpenAI以高度闭源的GPT-5在全球创造了约42亿美元的年化ARR;与此同时,Llama 4开源后在全球开发者中迅速成为标准参考,Meta的Reality Labs和云广告业务间接受益于AI生态影响力;DeepSeek以开源方式建立了全球知名度,其API收费服务在商业化用户中迅速获取份额。

中国政策环境对开源模式更为友好:备案制度只要求通过安全评估,并不要求模型必须闭源;而中国庞大的政府和央企采购市场,对"可以私有化部署"的开源模型有天然偏好——因为私有化部署意味着数据不离开企业控制范围,满足了政府对数据安全的严格要求。这是中国大模型公司普遍在开源方向上积极投入的市场逻辑根基。

十一、2026—2030年预测:三条主线与核心变量

11.1 基础模型整合:从"百模大战"到"十强格局"

2025年初,中国有700+大模型备案;2026年预计进入整合期,真正有持续投入能力的基础模型公司将收窄至10—15家。整合驱动力有三:其一,训练超大规模模型需要单次数千万至数亿美元的算力投入,绝大多数创业公司无力持续;其二,开源大模型(Qwen3、DeepSeek V3)的能力已足够支撑大多数垂类场景,独立垂类大模型公司的壁垒持续下降;其三,应用层的成功越来越依赖场景深度而非模型通用性,推动玩家向应用层收敛。

预计2030年,中国AI大模型格局将形成"4超(百度/阿里/字节/腾讯)+3强(DeepSeek/智谱/月之暗面)+N垂类"的稳定结构,总市场规模中口径有望达5000亿元以上。

预测这一整合路径,有几个具体的时间窗口值得关注:

2026年中的战略分叉时刻:经过2023—2025年的大规模融资与烧钱阶段,部分中型大模型公司将在2026年上半年遭遇下一轮融资困难(估值难以提升、老股东续约意愿下降、营收增速低于预期)。这一时期将出现第一波整合——被战略收购(并入互联网巨头或央企AI基金)或被迫收缩为纯应用层公司(放弃基础模型研发)。

2027年的商业化验证关口:经历整合后,2027年将是幸存大模型公司的商业化集体验证年——能否将累计的技术投入转化为稳定的、超过10亿元ARR的收入来源,将决定其能否维持独立发展。预计届时仅有5—7家中国大模型公司能够通过这一关口,其余将以不同方式并入更大的生态体系。

2028—2030年的稳定期:经历两轮洗牌后,存活下来的公司将形成相对稳定的专业化分工:顶部3—4家提供通用基础模型+云服务(互联网巨头主导);中部3—5家专注于垂直行业深度模型(金融/医疗/制造/法律);底部形成开放的MaaS市场,以国产开源模型为底层,基础模型的边际调用成本趋近于零,商业价值完全沉淀在上层应用和数据资产中。

11.2 Agent爆发:2026年企业AI的决定性赛道

Agent是2026年AI产业最确定的增量。从当前52%的企业Agent生产部署率到Salesforce预测的2026年80%,意味着在12个月内又有28%的企业新增Agent部署,折算成新增企业级订阅ARR估计在全球范围内超过500亿美元。

中国Agent市场的爆发节点预计在2026年下半年,核心驱动是MCP(Model Context Protocol)标准的推广(已被主流大模型厂商采纳,标准化了Agent与外部工具的交互接口)和AI操作系统的出现(字节扣子平台、百度ERNIE Agent平台、华为AI原生手机OS)。对制造业而言,Agent在采购比价、工艺优化、质检自动化三个场景的渗透最快,天下工厂所服务的480万家制造业工厂客户,正是Agent驱动销售线索挖掘的最大潜在受益方。

企业Agent的商业模式创新值得单独深究:

模式一:任务型定价(Per-Task Pricing)。以成功完成一个具体任务(生成一份合格的竞争分析报告、完成一次复杂的客户服务处理)为计费单位,而非以API调用次数或时间订阅为基础。这种定价方式对企业采购决策者更友好(ROI可量化),但要求Agent服务商承担更高的工程可靠性压力(任务完成率必须超过阈值,才能证明定价合理)。

模式二:人力替代效益分成。与企业签订"AI Agent替代N个人力岗位,费用为等量人力成本的30—50%"的合同结构,企业节省人力成本,AI服务商收取效益分成。这一模式在客服中心(AI Agent替代人工坐席)和财务对账(AI Agent替代会计助理)等场景已有规模化案例,但需要Agent可靠性极高(98%+的正确率)且有完善的例外处理机制。

模式三:垂直工作流AI OS。将Agent嵌入一套完整的垂直行业工作流操作系统中,以SaaS订阅方式向行业客户收费。用户无需自己组装工具和Agent,只需打开行业专属AI平台即可使用。这一模式结合了SaaS的可预期收入特性和Agent的高价值创造,是2026年最被资本看好的企业AI商业形态,代表性公司包括面向保险行业的Otter.ai、面向招聘行业的HireQuotient等垂直Agent平台,国内则有第四范式面向金融行业的Sage AIOS系列。

11.3 AI设备渗透加速:2026—2028年消费电子的AI化

2026年是端侧AI的关键节点:AI手机在中国出货量占比超50%(1.47亿台),AI PC占比超50%(全球),AI眼镜出货量全球超3000万台。到2028年,绝大多数旗舰消费电子设备将内置本地大模型推理能力,AI设备的边界从"特定功能"扩展到"全场景智能化助手"。

这一趋势对制造业供应链的影响是:高功效NPU(AI处理单元)需求激增,相关AI芯片国产替代(紫光展锐、海思麒麟、华为Kirin)迎来加速窗口;先进封装(HBM、CoWoS)产能持续紧张;高端散热(均热板、VC、液冷)需求因芯片热密度提升而快速增长。

11.3.1 AI设备制造的供应链机遇

AI设备的爆发增长对中国制造业供应链提出了新的需求结构,值得具体拆解:

高功效NPU(神经网络处理单元)的需求增长:2026年出货的AI手机旗舰,每台设备内置NPU的算力将超过40 TOPS(每秒万亿次操作),是2022年旗舰手机的4—5倍。这要求台积电/三星的先进工艺(N3/N2节点)持续扩产,而中国本土芯片厂商(紫光展锐、海思)的端侧AI芯片能力提升是2026—2028年国产替代的重要战场。

高性能内存与存储的升级需求:端侧大模型推理需要将模型权重常驻内存,对LPDDR5X(带宽≥135GB/s)和大容量UFS 4.0存储有强需求。这直接拉动三星、SK海力士、美光(进口)及中国长鑫存储的LPDDR5X产能,同时推动存储设备供应链向更高密度和更低功耗方向演进。

超薄散热技术的系统性需求:AI手机和AI眼镜的超薄形态对散热的挑战是内在的——越薄、越追求外观轻薄,散热设计空间越小,但AI芯片的热密度越高。均热板(Vapor Chamber,VC)和超薄导热硅胶片是当前移动设备散热的主流方案,深圳、苏州聚集了大量散热设备制造商(飞荣达、中石科技、超众科技),这一细分赛道在AI设备渗透加速下需求确定性极高。

AI眼镜的光学模组创新需求:智能眼镜在摄像头模组方面有独特挑战——要求超小尺寸(嵌入镜腿或镜框)、超低功耗(长续航是用户体验核心)和较高的成像质量(用于视觉感知,需支持实时视频流)。这与传统手机摄像头模组的设计哲学显著不同,催生了专门针对眼镜形态优化的微型摄像头模组供应商(舜宇光学、欧菲光等已切入这一赛道)。

11.4 推理算力主导时代

训练算力是过去三年的主题,推理算力是未来三年的主题。2026年推理算力占总AI算力消耗将超过70%,单纯依靠扩大训练规模的"Scaling Law"路线将让位于"推理效率+端云协同"的新范式。

GPU服务器AI服务器供应商来说,这意味着采购重心从8卡训练服务器(H100/A100)转向4卡/2卡推理服务器(L40S/H20/昇腾910B);对数据中心基础设施而言,液冷服务器数据中心制冷需求仍将高增,但峰值功耗密度可能因推理卡的热密度相对较低而有所缓和。

推理时代的到来重塑了AI算力市场的三个核心竞争维度:

竞争维度一:Token经济性(Tokens per Dollar)。推理的核心竞争力已不再是"能训练多大的模型",而是"每花一美元能产出多少高质量的output tokens"。在这一维度上,DeepSeek的工程优化使其相对于同等能力的OpenAI模型,Token经济性提升约5—10倍;国产AI加速卡在推理侧的成本优势(人民币计价、政府补贴加持)进一步改善了国内AI云厂商的经济性。

竞争维度二:响应延迟(Time to First Token/Total Latency)。对话类AI应用对响应延迟极为敏感——用户等待超过3秒就会产生明显的挫败感。推理服务商在降低首次响应时间(TTFT,Time to First Token,从发出请求到看到第一个字符的延迟)上投入了大量工程资源,包括前置请求预测(Speculative Decoding)、批处理优化(Continuous Batching)和KV Cache共享(Prefix Caching)等技术。

竞争维度三:并发容量与弹性。热点AI产品(如某款爆款AI App发布新版本)可能在短时间内产生数倍于平时的请求流量。能够快速弹性扩容推理集群的服务商(阿里云、腾讯云)相较私有化部署方案,在高峰流量管理上有天然优势,这也是部分追求高弹性的AI应用选择云端推理而非自建集群的主要原因。

这三个竞争维度的综合表现,决定了AI推理服务商在"成本×速度×稳定性"三角上的市场位置。2026—2028年,我们预计将看到推理服务市场形成明显的分层:顶端3—5家云厂商占据超大规模、高并发场景;中腰部的专注推理的云服务商(硅基流动、蓝耘科技等)专注于成本敏感型开发者用户;底端的边缘推理节点(本地化、低延迟、高隐私)则由设备厂商和本地服务器厂商主导。

11.5 国产GPU渗透率展望

2025年国产AI加速卡中国市场份额41%是一个历史性突破,但这一份额主要集中于政府/央企的定向采购(受补贴政策驱动),在商业化市场中的份额仍显著低于英伟达。

2026—2028年国产GPU渗透的核心变量是软件生态:CUDA生态拥有超过数百万开发者和数十万优化算子库,华为昇腾和寒武纪若要在商业化训练市场替代英伟达,必须在框架兼容性(PyTorch、JAX对接)和算子优化完整度上达到"足够好"的水平,而不仅是硬件算力比拼。预计2028年国产GPU商业化市场份额有望升至25—30%,政府+央企市场份额超过60%。

国产GPU的三条具体路径,各有侧重:

路径一:推理侧率先突破。推理工作负载(相对于训练)对软件生态的完整度要求更低——只需要运行已经训练好的模型权重,不需要训练所需的复杂梯度计算。寒武纪MLU370在多家云服务商(腾讯云、阿里云)的推理服务节点已有规模部署;海光DCU在科学计算和推理混合场景的稳定性已获得互联网大厂的内部验证。推理侧渗透有望在2026年达到商业化市场35—40%的份额。

路径二:大模型训练的国内大厂验证。百度、阿里、腾讯内部训练集群是国产GPU商业验证最重要的客户——如果这三家互联网巨头中的任何一家在其训练集群中将国产GPU比例提升至30%以上并公开验证,将对市场信心产生极大的正向示范效应,推动其他商业客户的采购决策。目前三家均在小规模试验国产GPU训练集群,但尚未出现大规模商业化采购的公开宣布。

路径三:中小算力云和算力基地。地方政府主导的智算中心(如武汉人工智能计算中心、合肥高新区算力基地)是国产GPU最无阻力的批量落地场景——这些中心以政府项目形式建设,国产化率是重要的考核指标。这一路径的商业价值在于:通过在政府算力基地的大规模部署,国产GPU厂商积累了系统稳定性数据和工程优化经验,形成向商业客户推广的参考案例库。

从全球视角看,国产GPU的突破不仅仅是市场份额的问题,更关系到中国AI产业在下一个十年维持高速发展的能力上限。如果国产GPU无法在2028年前达到商业化质量,中国AI大模型训练将持续受制于H20的算力天花板(约为H100的22%),制约中国在超大规模预训练模型方向的技术探索深度,形成"算法创新被算力约束"的发展瓶颈。

11.6 2026—2028年全球AI格局的五大关键变量

对于未来三年全球AI格局的走向,存在以下五个关键的不确定性变量,其走向将决定市场格局的最终形态:

变量一:AGI突破的时间节点。OpenAI、DeepMind、Anthropic均在2025年表示"通用人工智能"(AGI)在技术路径上已有明确方向,但对时间节点的判断分歧极大(从2027年到2035年不等)。若AGI在2028年之前实现(按某种有限定义),将触发监管、就业、国家安全等多维度的社会大震荡,AI产业商业格局将被完全重构,当前的竞争分析将大规模失效。若AGI在2030年后才实现,则当前的渐进式商业化路径和产业格局大体仍将适用。

变量二:美国AI监管政策的方向。美国联邦层面AI立法的缺失(至2026年初仍无统一联邦AI监管法规),使州级AI监管(加州、伊利诺伊等)和行业监管(FDA对医疗AI、SEC对金融AI)相互割裂。若2026年联邦层面通过基础性AI监管框架,将对AI产业的合规成本、产品设计和国际竞争格局产生深远影响——尤其是对中国AI出海到美国市场的空间构成直接约束。

变量三:中国半导体自主可控的突破速度。寒武纪、华为昇腾在训练侧的商业化突破能否在2028年前实现,决定了中国AI产业能否摆脱对英伟达GPU的战略依赖。这一变量不仅影响算力成本,也直接影响中国AI大模型在超大规模预训练方向的技术探索深度。

变量四:AI应用的"杀手级"场景是否出现。移动互联网时代,微信(即时通讯)、抖音(短视频)、拼多多(社交电商)是推动移动互联网大规模普及的三个"杀手级"应用。AI时代的"杀手级"应用是什么,目前尚无定论——当前的最强候选包括:AI编程(GitHub Copilot、Claude Code)、AI办公(Microsoft 365 Copilot)、AI伴侣(Character.ai、星野、Replika)。若AI伴侣在2027年前实现数亿月活的社会级渗透,将彻底重构ToC商业化的估值逻辑。

变量五:能源与算力约束的边界。全球数据中心电力消耗已在2025年超过1000TWh/年,预计2028年将超过2000TWh。若能源约束在2027—2028年前于主要AI市场(美国、中国)形成真实的新建算力瓶颈(新建许可延迟、绿电配额不足),将迫使AI厂商大幅提升推理效率,加速端侧模型和MoE架构的普及,间接有利于在效率路线上领先的中国大模型公司。

11.7 产业地图:2026年值得关注的细分板块

从投资和战略布局角度,以下是2026年中国AI产业链中最值得跟踪的九个细分板块,以及各板块的核心逻辑和代表性公司:

板块一:推理云服务(Inference-as-a-Service)。随着推理需求超越训练成为主要算力消耗,专注于低延迟、高吞吐推理服务的云平台将迎来增长红利期。代表公司:火山引擎(字节)、阿里云百炼、智谱开放平台、硅基流动(SiliconCloud)。

板块二:垂直行业Agent平台。比通用AI应用更深、比通用MaaS平台更窄,针对特定行业(金融/医疗/制造/法律)提供端到端的Agent工作流自动化。代表公司:第四范式(金融)、百川医疗(医疗)、信也科技AI(消费金融)、海致科技(政务)。

板块三:企业私有化部署。大型企业(央企、国有银行、头部制造商)对数据安全的极高要求,推动了私有化大模型部署的刚性需求——模型和数据均在企业自有服务器上运行,外部厂商无法访问。这一市场规模大、定制化程度高,是传统IT服务商(华为云、中科软)和大模型创业公司(智谱、第四范式)共同角力的核心战场。

板块四:AI写作与内容工具(CreatorAI)。视频脚本生成、广告文案写作、商品详情页生成是当前内容AI商业化最成熟的三个子场景,国内字节豆包创作、秘塔写作猫、通义灵机均在此方向持续投入。2026年随着视频生成质量提升,AI赋能创作者的商业化空间将进一步扩大。

板块五:AI操作系统与软件基础设施。长期来看,大模型将成为嵌入各类操作系统和工具链的基础组件,就像今天的数据库和消息队列一样"无处不在"。阿里、腾讯、华为的AI原生OS战略,以及LangChain、LlamaIndex等开发者框架,代表了这一演进方向的不同视角。

板块六:国产AI芯片(推理侧)。寒武纪(688256)、海光信息(688041)、燧原科技(非上市)在推理算力侧的竞争态势值得持续跟踪,2026年的商业化大厂订单进展是关键数据点。

板块七:AI硬件(消费终端)。AI眼镜(博思通讯、博士眼镜AI版)、AI学习机(科大讯飞、步步高)、AI手机(华为、小米、荣耀)是消费AI变现效率最高的三个品类,相关供应链(摄像头模组、NPU芯片、散热)受益确定性强。

板块八:AI数据服务。高质量标注数据、合成数据生成、数据质量评估是支撑大模型持续迭代的隐性基础设施。数据标注龙头(海天瑞声、数据堂)在大模型时代的估值逻辑正在从"劳动密集型外包"转向"AI训练战略资产供应商",值得关注其在高附加值数据产品(医疗影像标注、法律文书理解数据集)上的布局。

板块九:AI合规与安全。随着生成式AI备案监管和安全评测标准化落地,AI安全检测(有害内容过滤、隐私合规审计、对抗样本检测)正在形成独立的细分市场。奇安信、安恒信息、绿盟科技等安全厂商已将AI安全作为新的增长曲线布局,2026年有望在政府和金融行业实现规模化销售。

综合来看,上述九个细分板块并非彼此孤立——最大的结构性机遇往往出现在跨板块的交叉点:推理云(板块一)+垂直Agent(板块二)的组合,将孕育出行业Agent平台商(类似于Salesforce在CRM赛道的定位);AI芯片(板块六)+AI硬件(板块七)的协同,将决定哪家中国消费电子厂商能在AI设备时代实现苹果式的软硬件一体化护城河。2026年后,板块之间的边界将比当前更加模糊,复合型的生态布局能力将成为长期赢家的核心差异化点。

十二、结论:应用爆发元年已至,供应链仍是真实战场

2025年是中国AI大模型真正意义上的"应用元年":商业化拐点已经确认,但规模化ARR的路径仍在摸索。中国AI产业在这一年完成了三个关键跃迁:技术上,以DeepSeek为代表的工程效率派证明了"低成本高性能"可能;商业上,出海赛道(MiniMax/Kimi)验证了中国AI模型的全球竞争力;政策上,备案制与安全标准构建了有利于合规经营者的市场进入壁垒。站在2026年中期的视角回望,最值得铭记的不是哪家公司赢得了评测排行榜,而是整个产业链从"试验期"迈入"兑现期"这一结构性转变本身——这一转变带来的机遇与挑战,将在未来五年深刻塑造中国科技产业的竞争版图。

12.1 三大结构性结论

结论一:"应用才是战场,模型只是入场券"。2023年大家争先恐后发布大模型,2024年评测分数成为战场,2025年以后市场逻辑已经切换——当主流模型能力趋同后,谁能将AI能力深度嵌入用户的核心工作流、谁能建立持久的数据飞轮、谁能以最低成本获得最高质量的真实用户反馈,谁才是最终的商业赢家。这一切换对大型科技平台(拥有庞大流量底盘)的有利程度,远高于纯模型创业公司。

结论二:中国AI的全球竞争力已从"技术跟随"进入"局部引领"。DeepSeek-R1在全球范围内引发的技术震荡、Qwen3在开源生态的全球下载量第一、MiniMax M2.5在OpenRouter调用量第一——这三件事共同证明:中国AI不再是美国AI的"追随者",在特定维度(工程效率、开源生态影响力、价格竞争力)上已进入领先位置。这一判断与外界有时看到的"中国AI受制于GPU限制"形成了对比——算力约束确实存在,但中国工程师将"约束"转化成了"效率创新"的驱动力。

结论三:供应链是AI产业最被低估的基础。无论大模型的算法如何先进,背后都需要真实的物理基础设施支撑——GPU服务器的制造、光模块的生产、液冷服务器的散热、AI芯片的封测——都依赖中国制造业的真实产能。AI革命不是一场纯粹的软件革命,它同时是一场制造业革命;而中国制造业在这场革命中扮演的角色,远比多数AI产业报告所揭示的更为核心。

12.2 给不同受众的核心建议

对投资者:聚焦有真实ARR成长性的应用层公司(编程工具、AI办公、垂直行业Agent),以及AI供应链中供需确定性高的子赛道(液冷设备、光模块、高端散热);对基础模型创业公司保持审慎(估值与ARR的鸿沟需要至少3—5年才能弥合);关注出海赛道的商业化节点(MiniMax港股IPO、Kimi K2.5的季度收入趋势是关键信号)。

对企业决策者:AI已从"试点"进入"必须做"阶段——2025年超过50%的规模以上制造业企业已使用至少一种AI辅助工具,落后的企业将在成本效率上显著劣势。建议的切入优先级:代码辅助(立竿见影的ROI)→文档处理自动化→客服机器人→排产优化Agent。不建议在没有场景验证的情况下直接上马大规模私有化部署(投入大、风险高)。

对AI创业者:2025年以后,"再造一个通用大模型"已经没有窗口。有价值的方向集中在:有独特私有数据的垂直行业模型(医疗影像、工厂工艺、司法文书);深度嵌入特定工作流的Agent平台(专注一个行业做深,而非追求通用性);出海市场中欧美公司暂时未深度覆盖的地区(东南亚、中东、非洲)的AI产品本地化。

向前看,2026—2028年最重要的结构性机会在三个交叉点:Agent+制造业(将480万家制造工厂的采购/销售决策Agent化是天量市场);AI设备+消费品牌出海(安克、小米、科大讯飞的AI硬件出海路线已经验证可行);推理算力+国产替代(寒武纪/华为昇腾在推理侧的成本优势正在弱化英伟达的工程护城河)。

天下工厂平台记录了中国480万家在产工厂在GPU服务器AI服务器光模块液冷服务器AI芯片等AI硬件供应链中的真实分布——这张产业地图,是读懂AI产业从虚拟世界的模型到物理世界的生产力这一跃变的最真实底层数据。

12.3 方法论局限与前瞻性风险提示

任何关于AI行业的预测报告,都必须在数字和结论之前披露一个根本性的认知局限:AI大模型行业是人类历史上技术迭代速度最快的行业之一,2026年6月的现实与12个月前的预测之间的偏差率,往往高达50%以上。本报告所有数字均标注了来源和截止时间,但读者在引用时必须注意数据的时效性。

具体的方法论局限包括以下几个方面:

收入数据可靠性问题:中国AI大模型公司中绝大多数为非上市公司(DeepSeek、Kimi、MiniMax、百川等),其收入数据全部来自媒体披露、融资公告和分析师估算,无法通过财报核实。部分数字可能被公司或投资方有意放大(融资谈判的策略性信息披露),建议读者将本报告中的创业公司收入数字视为"量级参考"而非精确数值。

评测基准的可靠性问题:模型能力评测(MMLU、HumanEval、MATH等)存在"刷榜"问题——部分公司在训练集中有意加入与评测集高度相似的数据,导致在评测上的排名无法完全反映真实的通用能力。本报告尽量引用"盲测"类评测(如Chatbot Arena的基于人类偏好的投票排行)以降低此类偏差。

地缘政治风险的不可预测性:中美科技博弈的走向(芯片禁令升级/放松、市场准入限制的变化、出海政策的调整)对中国AI行业的影响是非线性的,任何一个政策决定都可能在数周内改变整个行业的竞争格局,远超量化模型所能捕捉的速度。

Agent商业化的不确定性:Agent被普遍预期为下一个AI商业化的核心战场,但截至2026年6月,企业级Agent项目中成功交付的比例(按合同价值计算)仍然偏低,"POC成功但规模化失败"是目前最常见的Agent项目结局。2026—2028年的Agent市场规模,实际上取决于工程可靠性问题能否在这三年内得到实质性解决——而这一问题目前尚无确定性答案。

理解上述局限,并不意味着应该对AI行业保持悲观——恰恰相反,认知到不确定性的存在,才能在快速变化的行业中做出更具适应性的战略决策:与其押注某一个具体的技术走向,不如优先建立对AI技术快速学习和应用的组织能力;与其等待市场格局清晰再行动,不如以快速试点+快速验证的方式积累实践经验。在AI时代,学习速度本身就是一种护城河。把握不确定性、在动态中保持清醒的方向感,是当下每一位决策者都需要持续修炼的核心能力,也是在AI浪潮中穿越产业周期、构建长期竞争优势的根本所在。

数据来源

本报告引用的主要数据与资料来源如下(按章节顺序排列):

  • OpenAI 官方发布(GPT-5 发布公告,2025 年 8 月),Sacra 估算(收入数据)
  • Anthropic 官方新闻(融资公告,2025 年 9 月—2026 年 6 月),Crunchbase 融资数据
  • Google DeepMind 官方博客(Gemini 3/3.5 发布公告,2025 年 11 月—2026 年),Wikipedia Gemini 3 词条
  • Meta AI 官方博客(Llama 4 发布,2025 年 4 月);TechCrunch Llama 追踪报道
  • NVIDIA SEC 8-K 文件(FY2025 年度财报,2025 年 2 月);TrendForce Blackwell 研究报告
  • xAI 官方公告;Sacra xAI 研究报告;Crunchbase 融资记录
  • Mistral AI 官网;欧盟 AI Act 官方文本
  • 中国网信办(CAC)官方公告——生成式 AI 服务备案名单(2025 年第一至第四季度)
  • 36 氪研究院《2025 年中国大模型行业发展研究报告》
  • 中商产业研究院《2024—2025 年中国 AI 大模型开发平台市场预测研究报告》
  • 艾媒咨询《2024—2025 年中国 AI 大模型市场现状及发展趋势研究报告》
  • IDC 中国智能终端市场十大洞察(2026 年);Canalys AI PC 预测(2025—2028 年)
  • 百度、阿里巴巴、腾讯、科大讯飞、金山办公、第四范式港股/A 股上市公司官方财报(2025 年半年报、三季报)
  • 澎湃新闻《1070 亿、930 家公司:2025 中国 AI 应用的野蛮共识》(2026 年 1 月)
  • 每日经济新闻(豆包 2025 年复盘);21 经济报道(寒武纪、海光信息营收数据)
  • 钛媒体(月之暗面估值与融资追踪);上海证券报(国产 GPU 市场格局)
  • Hugging Face 开源模型下载排行(2025 年 7 月数据)
  • OpenRouter 全球模型调用统计(2026 年 1—2 月数据)
  • 谷歌云《ROI of AI 2025 Report》;Salesforce Agent 预测研究
  • 天下工厂平台(www.tianxiagongchang.com)工厂数据库,覆盖 480 万家在产工厂,独立验证了 AI 硬件供应链在中国制造业的真实渗透分布