AI“入世”的阿里云方案

在阿里云等厂商的努力下，底层算力层的AI重构正在不断演进，开发生态同样也在不断完善，从局部的产品逻辑重塑，到行业层面的全面重塑，其速度只会越来越快。AI通过端到端的部署逐渐介入和改变物理世界，已经不再是伪命题。

以Chatgpt发布为锚点，其后的22个月，没人能否认，这是人类历史上AI发展速度最快的历史时期。

在刚刚过去的夏天，阿里云全面支撑巴黎奥运会实现了历史性突破，云计算首次超越卫星，成为奥运主要转播方式。所有的比赛转播画面，通过阿里云全球化覆盖的云计算基础设施，走向200多个国家和地区。这意味着阿里云在主要的国家和市场，已经完成了本地化建设，并拥有了相应的支持团队。

如果用发展的眼光看待，这些基础设施级别的投入，为AI时代乃至AGI的最终降临，提供了足够繁茂的生态和足够肥沃的土壤。横向扩展的AI开源社区，则让底层的模型和应用层的产品实现“自我造血”，获得更快的迭代速度。

时至今日，阿里云的AI布局也早已走出了“云”的范畴，到具体的产品和技术应用之上。陈列在云栖小镇的大模型和人形机器人，也让曾经藏在后端的AI，开始变得脚踏实地，触手可及。

改变的，不变的

2024年9月19日，2024云栖大会在杭州云栖小镇开幕。

相较于一年前，两次云栖大会的侧重点各有不同。2023年的云栖大会，将重点放在了算力、人工智能+、产业创新三个方向。可以看出，在“AI元年”，阿里云的重点在底层生态和后端基础设施的构建。

而到了今年，展馆主题则变成了“人工智能+、计算、前沿应用”。正如阿里巴巴集团CEO、阿里云智能集团董事长兼CEO吴泳铭在云栖大会所说，大模型技术在一年的时间里快速迭代，曾经停留在文本生成的大模型，已经具备了包括文本、语音、视觉在内的多模态能力，并开始能解决复杂问题。

也因此，在大会布置的“人工智能+馆”，集合了包括通义、百川、Kimi、智谱等各类大模型，无论是图片、音频、还是3D生成等前沿交互，都能在场馆内一站式体验到。

此外，曾经昂贵的模型推理成本，也在一年的时间里呈指数级下降，已经远远超过了摩尔定律。以阿里云的经验来看，通义千问API在阿里云百炼上的调用价格下降了97%，百万Tokens调用花费最低已经降到了5毛钱。

正因如此，在模型能力没有明显差距的前提下，谁的云计算资产分布越多，门类更全面，谁的推理成本也会相对更为低廉，而在AGI尚未到来的时间里，这将会是一场没有尽头的长征。“计算馆”则从产业链的角度，回顾了AI时代云计算的产业布局，这也是历次云栖大会的一脉相承。

AI对世界的改造，并不局限于互联网。如今很多业内人士仍然在用移动互联网时代的范式在思考，寄希望于AI行业也像之前那般，出现一个杀手级的超级APP。

吴泳铭则认为，AI最大的想象力绝对不是在手机屏幕上，AI最大的想象力是在通过渗透数字世界、接管数字世界，并改变物理世界，这才是AI最大的想象力。

何为“AI渗透物理世界”？一个简单的定义是“AI智能终端”，更直观的例子，则是AI机器人。

在本次云栖大会的“前沿应用馆”，一个随处可见的场景是，曾经还是程序形态的机器人，如今已经“得道化形”，变成了真正的“人”。

以北京银河通用机器人的“盖博特”机器人为例，它具备顶尖的抓取技术，用户只需在一台PAD上点击所需的饮料，机器人根据指令，就能准确地去货架上拿到，送到面前。根据工作人员的介绍，以后机器人店员将能跟真人一样，及时处理订单，并实现送货上门。

而同样的智能机器人企业，共有14家参与了云栖大会。虽然这只是AI机器人产业的冰山一角，但在某种程度上，已经开始宣告，AI已经通过这种方式，开始了对现实世界的影响和改造。

从AGI到终端部署

截至目前大模型的能力还远远谈不上“实现AGI”。但就方向而言，已经走在了正确的道路上。

以OpenAI新近发布的O1模型为例，它以更慢的推理速度，换来了解决更复杂问题的能力。在阶跃星辰创始人姜大昕看来，它第一次证明了大语言模型可以像人脑一般“慢思考”。

相比此前GPT4的即时输入，即时生成，虽然它能把一个复杂的问题拆解成很多步，然后分步去解决，但仍然难逃直线性思维的窠臼——而以O1模型为代表的技术路径，则是结合了模仿学习和强化学习，已经初步具备了人脑思维范式的相关特点。

而在清华大学人工智能研究院副院长、生数科技首席科学家朱军眼中，如果按业界对于AGI的“L1-L5”分级体系，ChatGPT为代表的聊天机器人，停留在L1级别；O1模型为代表的复杂推理模型，则能定义为L2，但在某些特定任务下，已经实现了较为高阶的智能水平。换言之，这也代表着整个AI业界，水平上限的再次提升。

但上述各种模型，即便已经做到了“上云”，在没有进入能够物理互动的终端之前，很难说“影响现实世界”。

基于同样的标准，端到端的自动驾驶，或许是大模型在自动驾驶第一次大规模的商业化落地。

在小鹏汽车董事长何小鹏看来，AI想要真正“入世”，数字世界的维度和物理世界的维度一定不同，后者一定会慢于前者。也因此，只有当软件、硬件、用户、政策法规发生变革，且这四个变革放在一起，才能称得上物理世界的变革。

而自动驾驶在过去两年的历史机遇在于，真人司机的精力即便再大，水平再高，也无法完全胜任世界上所有的驾驶场景，而端到端的大模型加持的自动驾驶，则能很好地弥补这一点，把自动驾驶的下限和上限，都进行明显的拓宽。最终的理想情况则是，一个一般水平的汽车用户，可以在自动驾驶的加持之下，在每个城市的驾驶水平都能如同一个老司机——这就是端到端的大模型，在用户一侧最明显的感知。

用“GPU”，把整个行业重做一遍

无论是更高、更快、更强的大模型和智能体，还是正在大规模落地的端到端自动驾驶，模型层和应用层的日新月异超乎了大多数人的想象。

同时也不得不承认，这一轮人工智能浪潮，比以往任何一波都更快，更密集：其一是有更实际的技术路径支撑，其二是资本增密的速度远超以往任何一波AI浪潮。它们依赖的共同技术基础和硬件基础，在于AI的爆发，带来的计算体系的变革。

在吴泳铭看来，过去几十年，CPU主导的计算体系，正在加速向GPU主导的AI计算体系转移。未来几乎所有的软硬件都会具备推理能力，它们的计算内核将变成GPU AI算力为主、CPU传统计算为辅的计算模式。

而从市场反馈来看，超过50%的新需求由AI驱动产生，因此云计算设备的迭代呼之欲出。

相较传统IT时代，AI驱动的阿里云全系产品，也迎来了家族升级。据阿里云CTO周靖人介绍，“云厂商拥有全栈技术储备，并通过基础设施的全面升级，让AI训练、推理、部署和应用整个生命周期变得更高效。”

譬如最新上线的磐久AI服务器，它不仅支持单机16卡、显存1.5T，还能提供AI算法预测GPU故障，准确率达92%；

阿里云ACS也首次推出了GPU容器算力，通过拓扑感知调度，实现计算亲和度和性能的提升；为AI设计的高性能网络架构HPN7.0，可稳定连接超过10万个GPU ，模型端到端训练性能提升10%以上。

随着AI基础设施全面革新，其中一个技术红利是模型的使用成本也越来越低。以通义千问三款主力模型为例，其价格降幅普遍在80%以上，最高达85%，这意味着接入通义千问的企业，调用模型的成本降低，速度已经远超摩尔定律。

以距离AI技术最近，大模型结合场景最丰富的游戏行业为例，巨人网络已经在游戏创作、内部提效等方面全面拥抱AI——在云栖大会现场最新亮相的“巨人摹境”，也是首个支持团队协作的AI绘画生产平台，构建起协作式标准AI美术工业化管线，一键式工作流实现复杂任务简化，适用于团队大规模美术向内容生产。

而作为国内第一款“AI+游戏”，网易旗下的《逆水寒》手游将游戏服上云，将AI引擎的推理部署也放在云上；最新上线的《永劫无间》手游，则在全面拥抱阿里云原生服务的同时，应用了在阿里云上完成高效推理的“AI队友”。这也是网易27年历史上，单日新增玩家最高的游戏。

以过往的历史经验来看，在AI发展历史上的三次浪潮中，无数行业人士对于新的技术革命，都持有短期高估和长期低估的惯性思维。这是新技术一定存在的低渗透率使然。

但站在发展的角度来看，长期停留在“玩具级”的AI产品，如今在硬件算力和软件革新的双重加持下，早已脱胎换骨，已经初步具备了介入现实世界的能力，而这只是从“生成式AI元年”开启，不到两年内发生的事情。

毫无疑问，在阿里云等厂商的努力下，底层算力层的AI重构正在不断演进，开发生态同样也在不断完善，从局部的产品逻辑重塑，到行业层面的全面重塑，其速度只会越来越快。AI通过端到端的部署逐渐介入和改变物理世界，已经不再是伪命题。

古典风资讯网

陆玖商业评论