大模型商业化：热闹背后的真实处境

最近跟几个做AI的朋友聊天，大家有一个共同的感受：大模型商业化这件事，比想象中复杂得多。

不是说技术不行，也不是说没有需求。而是从"技术能用"到"商业上跑通"，中间有一道很多人没预料到的鸿沟。技术可以靠论文推动，但商业需要客户买单——这是两套完全不同的评价体系。

最现实的问题：客户到底愿意为什么买单？

大模型厂商现在面对一个尴尬的局面：演示的时候惊艳全场，到了签合同的时候，客户会问一个很朴素的问题——"我用你这个，到底能省多少钱或者多赚多少钱？"

这个问题不好回答。

很多AI应用的ROI（投资回报率）很难精确量化。你说"提升了效率"，但效率提升了多少？节省了多少人力？这些数字在很多时候是模糊的。比如一个AI客服系统，客户说"能提升用户满意度5%"，但这个满意度怎么量化成收入增加？客户不傻，如果算不清楚账，他们宁愿先观望。

我观察到一个现象：那些商业化跑得比较快的，往往是能直接帮客户省钱或赚钱的场景。

比如客服自动化——原来需要 100 个客服，现在 AI 能处理 60% 的重复咨询，只需 40 个客服处理复杂案例。一年省了 60 个人的人力成本，按每人均成本 10 万算就是 600 万，这个账很好算。

比如代码辅助——GitHub Copilot 这类工具，原来一个功能开发一周，现在三天。按工程师日薪折算，每个需求省了 40% 的开发时间，一年下来对于一个几百人的开发团队是很可观的数字。

比如营销文案生成——原来一个文案一天写 10 条，现在 AI 辅助一天写 50 条，产出翻五倍，人力不增加。这种直接提高产出的模式 ROI 非常清晰。

但那些"提升体验"、"赋能创新"的场景，商业化就慢得多。比如"用AI提升用户活跃"、"用AI优化推荐算法提升留存"——这些价值是真实的，但量化链条太长，很难直接跟 AI 投入建立因果关系。客户在这种场景下倾向于内部立项而不是花大价钱买外部方案。

API模式：看起来很美

按API调用收费是目前最主流的模式，简单直接。但这个模式有一个隐忧：大模型的能力在趋同。

当各家模型的能力差距越来越小的时候，客户的选择标准就变成了——谁家便宜。这就很容易陷入价格战。

2023 年初，GPT-4 的价格是每千个 token 输入 $0.03、输出 $0.06。到 2024 年，Claude 3.5 Sonnet 的价格只有这个的十分之一，能力差距也不大。目前GPT-4o 的 API 价格已经降到 $0.0025/千 token，这个趋势还在继续。各家在拼命降价抢客户，但利润空间被越压越薄。

价格战对谁都不好：

厂商利润被压薄——OpenAI 据报 Anthropic 的运营利润率极低
没钱投入研发——降价降多了就没钱追前沿技术了
产品同质化——大家都能做，差异在哪？

所以我觉得，纯 API 模式的天花板是可见的。 它本质上是一个规模生意——你的量越大、成本摊得越低就越有优势，最终会像云计算市场一样只剩下几家巨头。

真正能持续赚钱的，一定是在 API 之上叠加了别的东西——行业知识、数据壁垒、工作流集成、客户服务。比如一家做 AI + 医疗的公司，如果把模型能力和医疗知识库、诊疗指南、合规要求整合在一起，客户（医院、药企）是很难找到平替的。这种"API + Know-how"的组合才有真正的护城河。

桌面端和本地部署的机会

除了云端 API，还有一个值得关注的趋势是桌面端和本地部署。

越来越多的用户在问：能不能在我的电脑上跑大模型？答案是肯定的，而且体验已经能满足很多场景：

7B 参数的模型（如 Llama-3-8B、Qwen-2.5-7B）：在消费级显卡（如 RTX 3090/4090）上就能流畅运行
量化后的模型：INT4 量化能把显存需求降到 4-8GB，笔记本上都能跑
端侧推理框架：Ollama、llama.cpp、MLX（苹果）等工具让本地部署变得简单

本地部署的商业化价值主要在三个方向：

隐私场景：企业数据不允许出本地，比如金融机构的内部知识库、军工单位的涉密文档处理
离线场景：工厂生产线、边缘设备、网络不稳定的环境（如远洋船舶、矿井）
成本场景：对于高频调用但不需要最强模型的场景，本地运行比云端 API 便宜得多

这个赛道的玩家包括 Ollama（开源自托管）、LM Studio（和上游固合作做的图形界面产品）、通义千问等都是。商业化路径可能不是卖模型，而是卖周边配套工具——管理工具、知识库集成、微调服务等。

垂直应用：看起来慢，但可能更稳

跟一个做法律AI的朋友聊，他们团队不大，但活得挺滋润。他们的做法是：不追求通用能力，就专注法律这一个领域，把合同审查、案例检索、法律文书生成做到极致。

这个思路我觉得是对的。通用大模型厂商做的是"水平"（覆盖各个行业），垂直应用做的是"深度"（把行业理解做深）。 在很多行业，深度比水平更重要。

医生不需要一个什么都会的 AI，他需要一个真正懂医疗的 AI——知道诊断指南、会用医学术语、理解影像报告、不会在药物剂量上出错。律师不需要一个通用助手，他需要一个能帮他快速找到相关判例、理解法律文书逻辑、熟悉不同法院判决倾向的工具。

垂直应用的商业逻辑：

客户是B端企业（医院、律所、金融机构），客单价高，续约率高
产品需要行业深度，大厂"顺便做"很难做深
客户粘性强——一旦嵌入业务流程，替换成本很高

垂直应用的挑战也不小：

市场空间可能没那么大（不像通用模型可以卖给所有人）
获客成本高——需要跟行业内的客户建立信任
需要真正懂行业的人来做——"既懂医疗又懂AI"的复合人才非常稀缺
如果通用大模型的能力快速提升，阈值不够深的垂直应用有被降维打击的风险

目前跑得比较好的垂直AI场景：法律（合同审查、案例检索）、金融（风控、研报生成）、医疗（影像诊断辅助、用药检查）、教育（自适应学习、智能辅导）、客服（智能客服）。每个领域的商业模式都有自己的特点，共同是——离钱越近越快。

大厂和创业公司，走的是不同的路

大厂做商业化，靠的是生态。把大模型能力嵌入到已有的产品矩阵里——云服务（AWS Bedrock、Azure OpenAI）、办公软件（Microsoft 365 Copilot、Google Workspace）、搜索引擎（Google AI Overviews、New Bing）、社交平台（Meta AI）。这条路的好处是用户基数大，不用花钱做市场教育，因为用户已经在你生态里了。

大厂的优势：钱多、用户多、数据多、品牌强。 产品和销售兼具。

创业公司没法这么玩，他们的策略通常是：找一个大厂看不上或者做不好的细分领域，扎进去做深。 这要求创业公司必须有真正的行业理解和技术壁垒，否则很容易被大厂"顺便做了"。

我见过一些创业公司，技术很强，但商业化做得很痛苦。原因就是他们解决的是"技术问题"而不是"商业问题"。技术问题可以用算法解决（准确率从 85% 提升到 95%），商业问题需要理解客户的业务流程、决策链条、预算周期——这些是课本上学不到的东西，需要在实战中积累。

一个思路是：创业公司不要去跟大厂比模型的"高大上"——那是烧钱的无底洞。而是去想"用现有模型能力（哪怕是公开的模型），解决哪些行业里的具体、有痛感的问题"。大模型能力本身是 commoditized（商品化了）的，真正的价值在于行业应用层。

几个竞争维度正在明确

从2024年到2026年，大模型商业化的竞争在几个维度上有了明显的分化：

通用对话——ChatGPT、Claude、Gemini 等。拼的是模型能力 + 用户习惯。赢家通吃的趋势明显。
企业定制——针对企业需求做定制方案。拼的是方案能力 + 实施经验。需要大量的工程师驻场、与客户深度绑定。
开发者工具——API、SDK、编排框架等。拼的是开发者体验 + 生态。LangChain、LlamaIndex 等框架生态已经比较成熟。
垂直领域应用——行业专用AI产品。拼的是行业知识 + 数据集。护城河深但天花板有限。
开源模型——Llama、Qwen、Mistral 等。拼的是社区 + 开发者采用。商业化路径还在探索（通过服务收费而非模型本身）。
端侧AI——在手机、PC、IoT 设备上运行的模型。拼的是体积 + 功耗 + 隐私。和手机厂商、操作系统厂商的合作是关键。

我的几个判断

判断一：大模型商业化不是"能不能"的问题，而是"多快"的问题。 方向是对的，需求是真实的，但需要时间。互联网从出现到真正商业化用了大约 5-7 年，大模型从 2022 年底爆发到现在只有 3 年多，商业化才刚刚开始。

判断二：最先跑通的会是那些 ROI 清晰、替代人工明确的场景。 客服、代码、营销文案、数据分析——这些领域的商业化会快于那些"赋能型"的场景。原因很简单：企业花钱看得到账。

判断三：纯技术优势越来越难维持商业优势。 模型能力会趋同，真正的壁垒在数据、在行业理解、在客户关系。未来 1-2 年内，"谁的模型更好"不会是主要竞争点，"谁更懂客户的业务"才是。

判断四：创业公司要活下来，必须找到自己的"钉子尖"。 在一个点上做到不可替代，比什么都会一点重要得多。滴水穿石的逻辑在这个赛道最适用。

判断五：国际市场 vs 国内市场会有不同的竞争格局。 国际市场上中国模型有成本优势，但面临合规和数据隐私方面的挑战。国内市场上模型能力在快速追赶，但商业化速度和付费习惯还在养成中。

大模型的商业化故事才写了第一章。现在下任何结论都太早，但有一点是确定的：能赚到钱的公司，一定是真正解决了客户问题的公司，而不只是技术最炫的公司。 踏实做产品和服务，比PPT上写"AI赋能万亿市场"，对这个行业健康得多。

大模型商业化：热闹背后的真实处境

大模型商业化：热闹背后的真实处境

最现实的问题：客户到底愿意为什么买单？

API模式：看起来很美

桌面端和本地部署的机会

垂直应用：看起来慢，但可能更稳

大厂和创业公司，走的是不同的路

几个竞争维度正在明确

我的几个判断

相关推荐

Apple联手Google：Gemini全面入驻iOS，AI生态格局生变

SpaceX的60页PPT凭什么值1.77万亿美元

Harness Engineering：让 AI Agent 从「能聊天」变成「能干活」的关键设计