商汤能拆出AI新未来吗？

时隔1个多月后，商汤组织架构调整的靴子，终于落地。

12月3日晚，商汤科技董事长兼CEO徐立发布内部信，宣布商汤科技将建立“1+X”架构：作为“1”的AI云以及通用视觉模型，将成为公司未来的核心业务；作为“X”的智能汽车“绝影”、家庭机器人“元萝卜”、智慧医疗、智慧零售等，将重组拆分为商汤的生态企业矩阵，并允许这些生态业务独立经营，可以自主面向外部融资乃至上市等。

商汤组织调整内部信

随着“1+X”架构的出台，商汤的此番战略重组也宣告正式完成，在组织关系上从一家AI 1.0的公司，转型成为一家瞄向大模型的AI 2.0公司。

成立十年来，上述对主营业务的重新划分，堪称商汤有史以来的最大一次转型，其目的直奔盈利而去。

徐立曾对外解释说，商汤正在靠两条腿走向盈利，一条腿是传统AI，技术成熟，不断降低成本、拓展市场（包括海外市场），聚焦利润贡献；另一条腿是新一代的AI大模型，目标是盈亏平衡，这条腿增长很快，且能看得到未来。前者保证商汤“走得够快”，后者保证“走得够远”。

最新一期财报表现，为徐立重新划分主营业务的决策，提供了更多说服力。2024年上半年，商汤总收入17.4亿元，同比增长21.4%。重新划分的三大业务中，生成式AI收入10.5亿元，同比大幅增长255.7%，占比超六成，已成为无可争议的公司主导业务。与此同时，2024年上半年，商汤亏损同比减少21.2%至24.8亿元。

作为AI 2.0时代的弄潮儿，ChatGPT发布之初，OpenAI估值还只有29亿美元，短短三年不到， OpenAI的估值已飙涨至1570亿美元。

更重要的是，随着生成式AI产品的继续发展，其前景还将继续推动OpenAI估值进一步攀升。研究机构IDC给出的预测提到，2027年全球生成式AI的市场规模将接近1500亿美元，复合增长率可达85.7%。

没人舍得放弃一个千亿美元的蓝海，商汤也不例外。

大模型技术不断迭代下的AI，正化身一头吞吃资源的怪兽，拉动生成式AI行业进入了一场资源比拼战。

进入2024年，大模型行业的最新变化之一是，模型技术迭代基本停滞，模型调优路线从Scaling Laws尺度定律，转向RL强化学习，其中代表事件便是GPT-o1的发布。

这也意味着，行业暂时告别算法主导，开始转向数据和算力主导。徐立近期在接受采访时所说，生成式AI时代除了模型的通用性之外，最大的特点是成本结构由“研发人员密集型”转化为“算力资源密集型”。

商汤董事长兼CEO徐立

为了避免在这场算力资源竞赛中掉队，10月份，OpenAI完成一轮高达66亿美元的新融资。11月份，Anthropic拿下亚马逊40亿美元的追加投资。那些实力不济的大模型玩家，在这场烧钱游戏中，或者被淘汰出局，或者被大厂收编。

在这场竞赛中，商汤的解法是，借助组织架构调整，走上聚焦资源主攻生成式AI的道路，无疑是一种更加切合自身实际的务实选择。

主观上，面对需要重金投入的生成式AI，难以分出更多资源支持生态业务发展的商汤，眼下允许它们独立运作，也是一个分则两利的抉择：既保证了核心主业生成式AI有更多子弹去打仗，又避免生态业务因此错失发展良机。

在被大模型重新激发活力的自动驾驶领域，商汤“绝影”智能汽车业务，2024年上半年收入1.7亿元，同比增长100.4%。

值得注意的是，当前自动驾驶相关领域正迎来资本热潮，文远知行、地平线、小马智行等一批公司相继在2024年完成上市。

被大模型带火的，除了自动驾驶领域，还有智慧医疗。OpenAI CEO奥特曼、百川智能CEO王小川都表达过对智慧医疗的商业化期待。

11月份，商汤参与组建的医疗公共服务大MaaS平台，其模型基座提供方正是“商汤日日新·大医”基础大模型。

此时，将“绝影”智能汽车、智慧医疗等业务纷纷推向资本市场，既可以使其借助外部融资力量，避免错失有利发展机遇，又可以通过更加市场化的独立经营手段，激活内部人才活力，提升组织效率。

为了在生成式AI时代挣得一席之地，商汤不是第一个对组织架构动刀的公司。

2023年4月，谷歌母公司Alphabet CEO桑达尔·皮查伊在官网发文，宣布公司将合并谷歌大脑（Google Brain）和DeepMind两大AI实验室，组成一个新部门Google DeepMind。

“Google DeepMind将所有的人才整合到一个团队当中，并在谷歌计算资源的支持下，有望显著加快谷歌在AI方面的进展。”皮查伊解释道。

一年后的2024年3月，微软也效仿谷歌，开始组建Microsoft AI，统一管理旗下所有的消费者AI产品和研究工作。这是微软历史首次将所有的消费者AI业务，归集到同一个事业部管理。

从谷歌到微软，再到商汤，组织架构调整的一大共性，都是为了将内部资源汇总聚焦到生成式AI上，从而提升大模型相关技术和产品的研发效率。

不同之处在于，在应对生成式AI所带来的时代机遇面前，商汤成了互联网巨头之外，在组织架构调整上反应最快的玩家。

作为对比的是，曾经与商汤同为AI 1.0时代明星企业的一些玩家，要么折戟IPO，要么在大模型方面被大厂甩落身后。商汤成了那个例外：不仅以“AI第一股”的名头登陆港交所，且顺利推出了自研的大模型和相关应用。

成功转型过渡的背后，离不开商汤对AI基础设施的押注，基于这一押注，商汤从一个深度学习研究实验室，发展成为计算机视觉的领军企业，并成长为中国领先的AI云服务提供商之一。

早在2019年，商汤便成为国内最早一批投入通用大模型研发的厂商，并开始将大规模AI基础设施建设投入提上日程，徐立一手组建了算力大装置团队。

截至2024年6月，商汤人工智能计算中心AIDC的运营总算力规模突破20000 PetaFLOPS，上线GPU数量达到5.4万张，稳居行业领先地位。

回过头来看，商汤在AI基础设施方面的投入和通用大模型的路线选择，与OpenAI的发展路线基本吻合，都在行业还不太笃定之际，选择率先押注Scaling Laws尺度定律，提前构筑起了一个相对充沛的算力池。

在充足的算力资源打底下，在过去近两年时间内，商汤日日新大模型由1.0 版本，迭代至5.5版本，实现了不输于GPT-4o的综合性能和实时交互体验。

如何在未来的大模型技术迭代和产品体验上，继续保持领先，商汤则展现着自己的另一种务实做派。

借助战略重组，将有限资源聚焦到生成式AI后，商汤选择了既做大模型又做应用的To B和To C双轮循环策略。

在ChatGPT推出两年后，一众大模型玩家相继找到了自己的发展策略：如月之暗面Kimi，就坚定要走To C的超级APP之路；如零一万物，则选择放弃国内To C应用机会，先做国外，在国内优先发展更易商业变现的To B领域。

财大气粗的互联网大厂，则选择了跟商汤类似的To B+To C路线。但不同之处在于，商汤在C端应用推广上显得更为克制和务实。

商汤的To B+To C路线，颇有点类似企业SaaS模式，即通过To B再接触C端用户。

以金融为例，商汤金融大模型已经相继落地中国银行、招商银行、宁波银行、上海银行、海通证券等企业客户，在帮助这些金融企业构建起大模型服务后，商汤自研的编程助手“代码小浣熊”、数字人视频生成平台“如影SenseAvatar”等应用，也都有了用武之地。

这是商汤应对互联网大厂竞争的独特思路。2024年初举办的商汤年会上，徐立回忆，商汤成立之初，没人相信中国公司能把人脸识别做到全球第一，觉得谷歌和Facebook等互联网大厂更易成功。但后续商汤的人脸识别等计算机视觉技术在全球各项比赛中拿下了70多个冠军，推翻了大公司更有机会做好这项技术的主流判断。

“这是商汤打破共识，形成反共识，再逐步塑造共识的过程。” 徐立认为，在生成式 AI 时代，商汤也能复现类似的过程。

借助大装置，起码在算力层面，商汤已迎来了反超机会。目前，商汤已成为市场上唯一一个独立于互联网大厂、不输于互联网大厂的大型AI云平台。在此基础上，在商汤创立十周年之际，徐立给商汤确立了“大装置-大模型-应用”的三位一体战略，致力于成为最懂算力的大模型服务商，和最懂大模型的算力服务商。

“大装置-大模型-应用”的三位一体战略，构筑起商汤在AI 2.0时代的最强竞争力，使其对内在既做模型又做应用的双轮循环策略之下，能够既避开模型能力不断进化后，很多应用场景可能被完全覆盖的风险，又不会错失借助应用强化模型基础能力的机会。

更重要的是，当生成式AI进入“算力资源密集型”新阶段后，为了AI的普及和商业化，一众大模型厂商纷纷打起价格战，开始了一场成本与效率的比拼。

想要降低大模型的生产和使用成本，不仅需要结合大模型来迭代和优化算力，也需要根据算力资源的特点来迭代大模型设计和应用。有着三位一体战略加持的商汤，既不缺少搭建算力资源的实操经验，又掌握着训练大模型的一线心得，这使得其在对外帮助合作伙伴提升算力资源的使用效率，以及增强大模型的服务能力方面，都能以尽可能低的成本，实现尽可能高的效率转化。

面对生成式AI这波可能是有史以来最大的科技变革浪潮，“有实力的公司肯定会提前投资。”通过最新的组织架构调整，徐立提前给商汤储备起弹药库，“短期成本并不那么重要。因为不投资可能意味着错失重大机会。这个风险远大于初始投资成本。”