大模型商业化:热闹背后的真实处境

大模型商业化:热闹背后的真实处境

最近跟几个做AI的朋友聊天,大家有一个共同的感受:大模型商业化这件事,比想象中复杂得多。

不是说技术不行,也不是说没有需求。而是从"技术能用"到"商业上跑通",中间有一道很多人没预料到的鸿沟。技术可以靠论文推动,但商业需要客户买单——这是两套完全不同的评价体系。

最现实的问题:客户到底愿意为什么买单?

大模型厂商现在面对一个尴尬的局面:演示的时候惊艳全场,到了签合同的时候,客户会问一个很朴素的问题——"我用你这个,到底能省多少钱或者多赚多少钱?"

这个问题不好回答。

很多AI应用的ROI(投资回报率)很难精确量化。你说"提升了效率",但效率提升了多少?节省了多少人力?这些数字在很多时候是模糊的。比如一个AI客服系统,客户说"能提升用户满意度5%",但这个满意度怎么量化成收入增加?客户不傻,如果算不清楚账,他们宁愿先观望。

我观察到一个现象:那些商业化跑得比较快的,往往是能直接帮客户省钱或赚钱的场景。

比如客服自动化——原来需要 100 个客服,现在 AI 能处理 60% 的重复咨询,只需 40 个客服处理复杂案例。一年省了 60 个人的人力成本,按每人均成本 10 万算就是 600 万,这个账很好算。

比如代码辅助——GitHub Copilot 这类工具,原来一个功能开发一周,现在三天。按工程师日薪折算,每个需求省了 40% 的开发时间,一年下来对于一个几百人的开发团队是很可观的数字。

比如营销文案生成——原来一个文案一天写 10 条,现在 AI 辅助一天写 50 条,产出翻五倍,人力不增加。这种直接提高产出的模式 ROI 非常清晰。

但那些"提升体验"、"赋能创新"的场景,商业化就慢得多。比如"用AI提升用户活跃"、"用AI优化推荐算法提升留存"——这些价值是真实的,但量化链条太长,很难直接跟 AI 投入建立因果关系。客户在这种场景下倾向于内部立项而不是花大价钱买外部方案。

API模式:看起来很美

按API调用收费是目前最主流的模式,简单直接。但这个模式有一个隐忧:大模型的能力在趋同。

当各家模型的能力差距越来越小的时候,客户的选择标准就变成了——谁家便宜。这就很容易陷入价格战。

2023 年初,GPT-4 的价格是每千个 token 输入 $0.03、输出 $0.06。到 2024 年,Claude 3.5 Sonnet 的价格只有这个的十分之一,能力差距也不大。目前GPT-4o 的 API 价格已经降到 $0.0025/千 token,这个趋势还在继续。各家在拼命降价抢客户,但利润空间被越压越薄。

价格战对谁都不好:

  • 厂商利润被压薄——OpenAI 据报 Anthropic 的运营利润率极低
  • 没钱投入研发——降价降多了就没钱追前沿技术了
  • 产品同质化——大家都能做,差异在哪?

所以我觉得,纯 API 模式的天花板是可见的。 它本质上是一个规模生意——你的量越大、成本摊得越低就越有优势,最终会像云计算市场一样只剩下几家巨头。

真正能持续赚钱的,一定是在 API 之上叠加了别的东西——行业知识、数据壁垒、工作流集成、客户服务。比如一家做 AI + 医疗的公司,如果把模型能力和医疗知识库、诊疗指南、合规要求整合在一起,客户(医院、药企)是很难找到平替的。这种"API + Know-how"的组合才有真正的护城河。

桌面端和本地部署的机会

除了云端 API,还有一个值得关注的趋势是桌面端和本地部署

越来越多的用户在问:能不能在我的电脑上跑大模型?答案是肯定的,而且体验已经能满足很多场景:

  • 7B 参数的模型(如 Llama-3-8B、Qwen-2.5-7B):在消费级显卡(如 RTX 3090/4090)上就能流畅运行
  • 量化后的模型:INT4 量化能把显存需求降到 4-8GB,笔记本上都能跑
  • 端侧推理框架:Ollama、llama.cpp、MLX(苹果)等工具让本地部署变得简单

本地部署的商业化价值主要在三个方向:

  1. 隐私场景:企业数据不允许出本地,比如金融机构的内部知识库、军工单位的涉密文档处理
  2. 离线场景:工厂生产线、边缘设备、网络不稳定的环境(如远洋船舶、矿井)
  3. 成本场景:对于高频调用但不需要最强模型的场景,本地运行比云端 API 便宜得多

这个赛道的玩家包括 Ollama(开源自托管)、LM Studio(和上游固合作做的图形界面产品)、通义千问等都是。商业化路径可能不是卖模型,而是卖周边配套工具——管理工具、知识库集成、微调服务等。

垂直应用:看起来慢,但可能更稳

跟一个做法律AI的朋友聊,他们团队不大,但活得挺滋润。他们的做法是:不追求通用能力,就专注法律这一个领域,把合同审查、案例检索、法律文书生成做到极致。

这个思路我觉得是对的。通用大模型厂商做的是"水平"(覆盖各个行业),垂直应用做的是"深度"(把行业理解做深)。 在很多行业,深度比水平更重要。

医生不需要一个什么都会的 AI,他需要一个真正懂医疗的 AI——知道诊断指南、会用医学术语、理解影像报告、不会在药物剂量上出错。律师不需要一个通用助手,他需要一个能帮他快速找到相关判例、理解法律文书逻辑、熟悉不同法院判决倾向的工具。

垂直应用的商业逻辑

  • 客户是B端企业(医院、律所、金融机构),客单价高,续约率高
  • 产品需要行业深度,大厂"顺便做"很难做深
  • 客户粘性强——一旦嵌入业务流程,替换成本很高

垂直应用的挑战也不小

  • 市场空间可能没那么大(不像通用模型可以卖给所有人)
  • 获客成本高——需要跟行业内的客户建立信任
  • 需要真正懂行业的人来做——"既懂医疗又懂AI"的复合人才非常稀缺
  • 如果通用大模型的能力快速提升,阈值不够深的垂直应用有被降维打击的风险

目前跑得比较好的垂直AI场景:法律(合同审查、案例检索)、金融(风控、研报生成)、医疗(影像诊断辅助、用药检查)、教育(自适应学习、智能辅导)、客服(智能客服)。每个领域的商业模式都有自己的特点,共同是——离钱越近越快。

大厂和创业公司,走的是不同的路

大厂做商业化,靠的是生态。把大模型能力嵌入到已有的产品矩阵里——云服务(AWS Bedrock、Azure OpenAI)、办公软件(Microsoft 365 Copilot、Google Workspace)、搜索引擎(Google AI Overviews、New Bing)、社交平台(Meta AI)。这条路的好处是用户基数大,不用花钱做市场教育,因为用户已经在你生态里了。

大厂的优势:钱多、用户多、数据多、品牌强。 产品和销售兼具。

创业公司没法这么玩,他们的策略通常是:找一个大厂看不上或者做不好的细分领域,扎进去做深。 这要求创业公司必须有真正的行业理解和技术壁垒,否则很容易被大厂"顺便做了"。

我见过一些创业公司,技术很强,但商业化做得很痛苦。原因就是他们解决的是"技术问题"而不是"商业问题"。技术问题可以用算法解决(准确率从 85% 提升到 95%),商业问题需要理解客户的业务流程、决策链条、预算周期——这些是课本上学不到的东西,需要在实战中积累。

一个思路是:创业公司不要去跟大厂比模型的"高大上"——那是烧钱的无底洞。而是去想"用现有模型能力(哪怕是公开的模型),解决哪些行业里的具体、有痛感的问题"。大模型能力本身是 commoditized(商品化了)的,真正的价值在于行业应用层。

几个竞争维度正在明确

从2024年到2026年,大模型商业化的竞争在几个维度上有了明显的分化:

  1. 通用对话——ChatGPT、Claude、Gemini 等。拼的是模型能力 + 用户习惯。赢家通吃的趋势明显。
  2. 企业定制——针对企业需求做定制方案。拼的是方案能力 + 实施经验。需要大量的工程师驻场、与客户深度绑定。
  3. 开发者工具——API、SDK、编排框架等。拼的是开发者体验 + 生态。LangChain、LlamaIndex 等框架生态已经比较成熟。
  4. 垂直领域应用——行业专用AI产品。拼的是行业知识 + 数据集。护城河深但天花板有限。
  5. 开源模型——Llama、Qwen、Mistral 等。拼的是社区 + 开发者采用。商业化路径还在探索(通过服务收费而非模型本身)。
  6. 端侧AI——在手机、PC、IoT 设备上运行的模型。拼的是体积 + 功耗 + 隐私。和手机厂商、操作系统厂商的合作是关键。

我的几个判断

判断一:大模型商业化不是"能不能"的问题,而是"多快"的问题。 方向是对的,需求是真实的,但需要时间。互联网从出现到真正商业化用了大约 5-7 年,大模型从 2022 年底爆发到现在只有 3 年多,商业化才刚刚开始。

判断二:最先跑通的会是那些 ROI 清晰、替代人工明确的场景。 客服、代码、营销文案、数据分析——这些领域的商业化会快于那些"赋能型"的场景。原因很简单:企业花钱看得到账。

判断三:纯技术优势越来越难维持商业优势。 模型能力会趋同,真正的壁垒在数据、在行业理解、在客户关系。未来 1-2 年内,"谁的模型更好"不会是主要竞争点,"谁更懂客户的业务"才是。

判断四:创业公司要活下来,必须找到自己的"钉子尖"。 在一个点上做到不可替代,比什么都会一点重要得多。滴水穿石的逻辑在这个赛道最适用。

判断五:国际市场 vs 国内市场会有不同的竞争格局。 国际市场上中国模型有成本优势,但面临合规和数据隐私方面的挑战。国内市场上模型能力在快速追赶,但商业化速度和付费习惯还在养成中。

大模型的商业化故事才写了第一章。现在下任何结论都太早,但有一点是确定的:能赚到钱的公司,一定是真正解决了客户问题的公司,而不只是技术最炫的公司。 踏实做产品和服务,比PPT上写"AI赋能万亿市场",对这个行业健康得多。