1、从自动驾驶到机器人,群体智能将掀开AI下一篇章?
在近期的2024 Inclusion·上海外滩大会上,Kevin Kelly对未来世界做出了新的假想:全球主义正在迅速推进,正在共同构建一个基于技术的“超级计算机”。每一台手机、笔记本电脑和数据服务器都将连接成一个巨大的计算系统,而每一台设备都是其中的一个小小的“神经元”。
“我们正在打造一个巨大的、全球性的、如行星般规模的机器。”他认为,尽管人们可能对设备和内容有不同的偏好,但这些差异只是交互方式上的不同,根本上它们都归属于同一个平台。世界上的所有数字技术,包括人工智能,都运行在这个新平台上。
如今,这台“超级计算机”正在以前所未有的规模和速度运行。这也驱动着创新加速,让新发明和新思想的传播速度越来越快。比如人们通过增强现实和虚拟现实技术来培训人员;通过机器及其他传感器来感知世界;通过ChatGPT等工具去学习新的东西。
人工智能群体智慧亟待开发
虽然当前的人工智能具备了基本逻辑能力,但还处于早期发展阶段。人们主要将人工智能应用于一些工具型任务,价值主要体现在提升效率。AI最有价值的地方在于它具备和人类不一样的思维,未来如果融入想象力、主观能动性,可以解决单靠人类无法解决的社会问题。
机器学习泰斗、美国“三院院士”Michael I. Jordan认为,“缺乏对集体性、不确定性和激励机制的关注,是当前对人工智能的讨论中缺失的三个方面。”
他表示,“生活本身充满了不确定性,人也是非常不确定,互相交流则是创造了一种降低不确定性的文化,这是人类做得非常好的事情之一。但当前的人工智能系统并没有很好地做到这一点,其不善于思考不确定性,也不善于团结起来应对不确定性。相较之下,人类在面对不确定性时表现出色,尤其是集体协作共同应对时。”
除了提升单个智能体的能力,他呼吁建立一种能够体现集体智慧的协同智能体系统。他认为,在AI的构建中,设法让机器具备类似的群体协作能力,成为了一个亟待解决的关键课题。仅仅将人类的智慧融入人工智能中仍然是不够的,现代信息技术在医疗、交通、金融科技和商业领域的应用,需要建立集体性的智能系统。但如何让当前的人工智能系统也具备类似的集体协作能力,仍是一个未解的关键问题。
智能的第二次涌现
人工智能经历了两次智能涌现,第一次智能涌现是神经网络的神经元达到一定量级后产生了质变。模型技术至今已经发展很多年了,包括最早2018年Bert本身也是大模型,之所以GPT带来革命性的影响,是因为其参数超过了一定量级,突破了100亿、1000亿,GPT-4参数量甚至达到万亿级别,由量变产生质变。
第二次群体智能涌现的本质是,当单体Agent足够多,各行各业都有专业的Agent,如果把这些Agent都聚集起来,协同合作去完成某项任务,这个过程中有可能会产生新的发现。
事实上,人类很早就已认识到,通过群体合作集思广益,解决问题的成效可以大过个体智慧的总和。关于群体智慧的力量,在科学上有个经典的实验:在玻璃罐中放满糖果,然后请试验者来猜测糖果的数量,记录每个人的答案、答案的平均数及其与正确答案之间的关系。
以美国哥伦比亚商学院的实验为例,糖果实际数目为1116颗,73个学生参加实验,73人的个人答案有多有少,但都离1116相差甚远,而73人个人答案的平均值却为1115颗,与糖果真实数量仅1颗之差。这本质上是个预测问题,其结果正体现了群体的智慧。
卡内基梅隆大学组织行为学专家Anita Woolley表示,影响一个团队发挥群体智慧的最大因素正是成员之间的协调程度。尽管群体的协作能带来1+1>2的效果,但知易行难。
而随着人类社会文明的进化,从农耕时代、工业时代到知识网络时代、数据智能时代,人工智能技术的深入发展,在渗透社会生活的同时,也辐射到了群体智慧。在机器文明时代下,能否将人类的群体智慧融入人工智能,形成单体智能的放大效应,从而进一步释放人类社会的潜能,是一个值得思考的议题。
当单个智能体相互关联并协作时,它们能够形成一个复杂而强大的群体智能系统,从而产生出更加卓越的智能涌现行为,这成为人工智能近年来一个重要的发展方向。
群体智能(Swarm Intelligence,SI)最早源于对以蚂蚁、蜜蜂等为代表的社会性昆虫的群体行为的研究,自1991年意大利学者Dorigo提出蚁群优化(Ant Colony Optimization,ACO)理论开始,群体智能作为一个理论被正式提出,并逐渐吸引了大批学者的关注,从而掀起了研究高潮。
1995年,Kennedy等学者提出粒子群优化算法(Particle Swarm Optimization,PSO),此后群体智能研究迅速展开。目前,群体智能的研究主要包括智能蚁群算法和粒子群算法,智能蚁群算法主要包括蚁群优化算法、蚁群聚类算法和多机器人协同合作系统。其中,蚁群优化算法和粒子群优化算法在求解实际问题时应用最为广泛。
群体智能的核心在于分布式决策和协作,它通过算法让众多小型智能单元协同工作,共同解决复杂问题。这种技术的应用范围广泛,从交通优化、城市规划、工业生产到智能医疗等领域,都能看到其身影。
例如,在一个智能交通系统中,每辆车都是一个智能体,它们需要根据路况和交通规则来选择合适的速度和路线,同时也需要与其他车辆和行人进行沟通和协调,以避免碰撞和拥堵。在一个智能医疗系统中,每个医生、护士、患者和设备都是一个智能体,它们需要根据病情和资源的分配来制定合理的诊疗方案,同时也需要与其他智能体进行信息的共享和决策的协商,以提高医疗的效率和质量。
以交通为例,公路驾车群体是按照交通规则,以公路系统为平台,由一群具备单体智能的人类驾驶或自动驾驶车辆所构成。单体智能的弱点在于个体感知、通讯和控制的局部性,与其行为决策对全局的影响性之间的矛盾。
对人类驾驶员而言,由于交通互动的无序和对未知交通环境的不了解,很难在遇到突发交通状况、并道或绕过路障时保持正常车速,往往会由于降低车速而形成道路拥堵。
对于自动驾驶车辆,其在行驶过程中,处理问题的优先级通常是以自身为出发点,也就是以自身的安全与效率最大化为前提。如果每辆车都如此规划的时候,就会带来很多冲突矛盾,比如在路口会遇到由于相互博弈而卡住不动的情况。随着自动驾驶汽车规模的逐步提升,这类问题将愈加突出。
如果没有外力的加入,单纯依靠自动驾驶车辆自身的决策系统,不足以对全局形成更好的结果,这时就需要一个能够掌握全局性信息的群体智能系统进行全局协调。虽然群体智能所产生的结果对于单体来讲可能不是最优,甚至会出现效率降低的情况,但对全局而言,则是一个效率最高的最优解,可以实现系统效能的提升。
比如在一个路口,全局最优解是要保证所有人的通行时间都被节省,而不是某一个特例或者某一台车的时间被节省。
目前国家正在大力推行的车路云一体化,就是群智智能的典型代表,其通过各类传感器、云控平台、感知算法、数据融合、预测模型等设备和技术,把每一辆车、每一台基站等智能个体,都变成一个信息节点,它们互联互通,形成一个可以共享信息、协同运行的智能体网络。这个智能体网络从全局视角,为自动驾驶车辆提供最优行驶路径建议,解决交通效率问题。
站在系统发展角度看,自动驾驶追求越来越极致的智能化,而车路云一体化则追求的是极致的系统智能。一个是单点的智能化,一个是系统的智能化,只有这样才能在不同维度上解决不同的问题。如果是单点的问题,就交给单车去解决;如果是系统的问题,就交给系统去解决,一定是在不同层面用不同的方式去解决,而不是用一套方法来解决所有问题。
未来,当无人机、机器人、机器狗等更多智能体接入车路云网络,就可以直接获得城市更加丰富、完整的信息,比如自动驾驶车辆可以获得完整的交通信息,无人机可以获得空域的数字化信息,机器狗、机器人可以获得各自行驶路径上相应的环境信息,这样就构建起了一个完整、安全、高效、实时的超级智能体网络,以此为基础的智能城市也将由此诞生。
Science 2016年的论文“群体之力量”(The Power of Crowds)认为:结合群体智慧与机器性能来解决快速增长难题时,群智计算按难易程度分为三种类型:实现任务分配的众包模式、较复杂支持工作流模式的群智、最复杂的协同求解问题的生态系统模式。
在具身智能领域,由大模型驱动的多智能体高效协作是重点研究方向之一。
此前,大模型在具身智能中主要用于解决单智能体的任务规划问题。然而,由于大模型知识和特定的具身环境没有对齐,大模型产生的规划往往难以在实际环境中执行。
举例来说,在打扫房间的任务中,大模型给出的规划可能是首先找到吸尘器。然而,环境中可能没有吸尘器,只能通过扫帚能完成该任务。
此时,大模型需要通过和环境的多轮交互和反馈来使其适应于具身环境,因而具有高昂的交互代价。
在多智能体环境中,每个智能体都使用大模型进行控制。而当多个智能体协同完成一项任务时,除了会遇到类似单智能体的环境不适配问题,还存在多智能体如何高效沟通和协作的难题。
如果直接通过多智能体对话协商,来进行协作的方法是低效的。一方面,很难完全通过对话得出有效的协同策略;另一方面,无法衡量单个智能体对总体任务目标的贡献(即信度分配),难以驱动每个智能体改进策略来提升总体收益。
因此,多智能体协作系统(Multi-Agent Collaboration Systems,MACS)就十分必要,其目标是使多个智能体能够有效地协作,以实现一些超出单个智能体能力范围的任务。该系统可以用于模拟和优化交通、能源、物流等复杂系统,也可以用于智能家居、智能城市、智能工厂等场景的设计和实现。
在MACS下,多智能体协作框架(Multi-Agent Collaboration Framework,MACF)提供了实现智能体间合作与竞争的方法和工具,包括智能体建模、交互协调、评估优化、适应演化和人机交互等方面,主要用于协调和控制多个智能体,以实现共同目标或解决共同问题。其核心是平衡智能体间的合作与竞争,解决任务分配、策略选择、信息共享、学习方式和人类参与等关键问题。
MACF的分布式协作方式强调在分散环境中智能体间的信息共享和任务分配,通过强化学习、反馈、智能合约等手段提高性能和适应性。当前,比较主流的多智能体技术框架包括AutoGen、MetaGPT、XAgent、AutoAgent、CrewAI等,这些项目从不同角度提出智能体系统规划模块的改进建议,其中包括长短期规划、规划输出格式、用户提示拓展解释、反馈迭代机制等,为多智能体高效协作奠定技术基础。
需要指出的是,多智能体产生群体智能的前提是单智能体本身已经具有较高的智能化水平。单智能体的能力边界很大程度上影响着群体智能的能力发挥,就好比蚁群或蜂群的个体数量再多、组织再严密,也无法制造出摩天大楼。因此,充分激发单智能体的能力是释放群体智能价值的前提,而群体智能也将对单体智能体的潜力进一步开发,形成互为支撑、相互融合、相互促进的良性关系。
道路曲折无碍前途光明
尽管存在算法复杂性、环境不确定性、人机交互和伦理法律遵守等挑战,但群体智能的发展前景依然广阔,其可以广泛应用于机器人、交通、教育、军事等各个领域,在提高系统性能和效率、增强系统鲁棒性和可扩展性、促进系统与人类的协同和互动方面发挥重要作用。
在机器人领域,群体智能可以使机器人能够完成更复杂和更困难的任务,提高机器人的灵活性和可靠性。比如在智能仓库中,每个机器人需要根据订单的内容和优先级,选择合适的货物和路径,同时也需要在群体智能系统下,与其他机器人开展协作,提高仓库的运营效率和客户满意度。
在智能救援场景中,机器人需要根据灾害的类型和程度,选择合适的工具和方法,同时也需要与其他机器人进行协同和支持,以提升救援的成功率和安全性。群体智能可以让机器人根据环境变化和任务需求,自动调整救援策略,并与其他机器人或人类进行有效协作。
针对教育场景,群体智能可以调动教师、学生、课程等各类资源,根据学习者特征、学习需求、学习目标、学习进度等,制定科学合理的教学和学习计划,从而提升教育效果。
在军事领域,群体智能还可以开启未来战场的全新模式。比如在超视距侦察系统中,无人机、卫星、雷达和传感器作为相互独立的智能体,需要在群体智能的系统框架下,根据任务要求和资源限制,与其他智能体开展合作,进行信息收集和全面分析,提高侦察的准确性和及时性。
虽然目前还没有一个完整的框架用来理解人工智能和群体智能间的交互,但作为人工智能的新兴分支,群体智能不仅展示了技术的革新力量,也为我们勾勒出一个智能社会的未来图景。在这个充满可能性的时代,我们期待群体智能为人类带来更多的惊喜和便利,同时,也需要保持警惕,确保科技进步的每一步都为人类福祉服务。
文章来源:极智GeeTech
2、“AI教母”李飞飞创业公司World Labs获2.3亿美元融资
近日,斯坦福大学教授、人工智能的 “教母”李飞飞的新创企 World Labs 成功融资2.3亿美元。据悉,World Labs 的首轮融资由 Andreessen Horowitz、New Enterprise Associates 和 Radical Ventures 共同领投,其他投资者包括 AMD、Intel Capital、英伟达的 NVentures 等。
此次融资让 World Labs 的估值超过了10亿美元,李飞飞的目标是将这笔资金用于打造前沿的 AI 技术。
World Labs 的愿景是开发能够理解和与3D 世界互动的 AI 模型。他们正在研发的 “巨大世界模型”,将为艺术家、设计师、开发者和工程师等专业人士提供支持。
Andreessen Horowitz 的合伙人马丁・卡萨多表示,World Labs 的潜在客户可以是游戏公司和电影制片厂等。这显示出李飞飞的团队不仅仅在研发技术,更在努力将其应用到实际的商业场景中。
值得一提的是,World Labs 计划在2025年推出首款产品,李飞飞对此充满期待。她认为,这款产品将推动 AI 技术的进一步发展,并为相关行业带来新的机遇。
李飞飞的背景使得她在这一领域深受尊敬,她在计算机视觉和机器学习方面的研究已产生了深远的影响。她希望通过 World Labs,能够为 AI 的未来贡献更多。
目前,这一消息在科技圈引发了广泛关注,大家都在期待李飞飞和她的团队会带来怎样的创新成果。毫无疑问,她的努力将会对3D AI 技术的发展产生深远的影响。
文章来源:AIbase基地
3、人形机器人落地,如何跑出“加速度”
2024世界机器人大会上,一款人形机器人在搬运物品。
一只机械手,灵活地对照观众的手势做出抓、握、伸手指等动作;一个与普通成年人等高的人形机器人,一步步上斜坡、爬楼梯、过障碍;在汽车生产线上,人形机器人尝试完成柔性装配、产品检测等复杂场景的工作……在日前举行的2024世界机器人大会上,169家企业的600余件创新产品亮相,多款人形机器人大放异彩。
10年前,人形机器人只会简单的肢体控制;如今,一些人形机器人已拥有聪慧的“大脑”、敏捷的“小脑”和灵活的“肢体”。随着技术水平不断提升、上下游产业链加快形成,人形机器人商业化应用有望跑出“加速度”。
机器越来越像“人”
去年底,优必选上市,成为我国“人形机器人第一股”;今年,特斯拉二代人形机器人“擎天柱”(Optimus)亮相……人形机器人话题热度持续攀升。
技术的进步,让机器越来越像“人”。
世界机器人合作组织理事长、中国科学院院士乔红说,目前,人形机器人专属部组件与材料逐渐走俏,高爆发电机、精密减速器、高精度传感器、长续航电池等核心零部件,将构筑起更加稳定、高性能的人形机器人硬件系统。同时,基于神经网络、图语法、进化算法等人工智能技术,人形机器人将能根据场景和任务需求,自动构建腿足、手臂、躯干等模块,实现形态和控制的协同优化。人形机器人多模态大模型将能通过融合语音、图像文本、传感信号、3D点云等多模态信息,为人形机器人的认知和决策规划提供更强的多模态理解、生成和关联能力,提升其在复杂场景任务中的泛化能力。
“过去,机器人没有自主运动控制能力,只能在固定环境完成单一任务。”北京具身智能机器人创新中心总经理熊友军说,如今,大模型的加持让人形机器人的“大脑”能以多模态方式实现人机交互。
蓝驰创投合伙人曹巍说,近年来大模型的应用对机器人行业产生了巨大影响。传统算法在复杂任务执行上的成功率普遍较低,而大模型的引入显著提升了机器人的执行能力,为未来商业化落地带来很大可能。宇树科技创始人王兴兴也认为,过去10年,深度强化学习和大语言模型对人形机器人发展影响深远。未来几年,这两项技术有望取得更大进展,进一步与人形机器人深度融合。
人机互补是趋势
那么,机器人取代人类的情节,会从科幻走向现实吗?
在熊友军看来,人形机器人并不会取代人类,它极有可能与人形成互补关系,提高生产效率和安全性。在工业场景,未来工厂可能会呈现“721”模式:70%的作业将由当前已广泛应用的专用机器人承担,如机械手臂、无人搬运车等;20%的任务将由人形机器人执行,它们能胜任专用机器人难以处理的复杂任务,并进入一些与人体适配性更高的场景;剩余10%的工作,由于技术或实际操作的限制,仍需依赖人工完成。
香港大学机器人与自动化首席教授、新兴技术研究所所长席宁认为,人形机器人的引入主要是为了完成人类不愿意或不适合从事的工作,从而进一步推动行业自动化和智能化。
“虽然很像人,但从实际功能上来讲,行业更希望它们能成为超限机器人,即超过人的能力限度做更多工作。”席宁说,“比如在柔韧性、稳定性、载重强度、工作时长等方面,人形机器人还有很大发展空间。”
商用之路需闯关
人形机器人技术加速演进,已成为科技竞争的新高地、未来产业的新赛道、经济发展的新引擎,发展潜力大、应用前景广。2023年10月,工业和信息化部印发的《人形机器人创新发展指导意见》(以下简称《意见》)提出了我国人形机器人产业发展的目标——到2025年,人形机器人创新体系初步建立;到2027年,人形机器人技术创新能力显著提升,综合实力达到世界先进水平。
我国丰富的产业生态和消费场景、广阔的市场空间以及大模型等技术的发展,为人形机器人加速奔跑提供了强大支撑。工业和信息化部最新统计显示,近3年,我国新增工业机器人装机量占全球一半以上,制造业机器人密度达到每万名工人470台,10年间增长近19倍。《华尔街日报》近日刊文称,日本和欧洲公司曾主导工业机器人行业,但一些中国公司正在迎头赶上。该报道援引研究公司MIR Databank的数据称,今年上半年,中国生产商占据中国工业机器人市场一半以上份额。相比之下,2022年全年这一比例约为36%。
但要看到的是,眼下,人形机器人商用整体处于起步阶段。让人形机器人走进千家万户,还需闯几道关?
一道是功能关。有业内人士坦言,目前人形机器人上肢精度大约在厘米级,与0.01毫米的工业级精度差距还相当大。《意见》提出,到2025年,人形机器人“大脑、小脑、肢体”等一批关键技术取得突破,确保核心部组件安全有效供给。例如,要开发基于人工智能大模型的人形机器人“大脑”,增强环境感知、行为控制、人机交互能力,推动云端和边缘端智能协同部署;要开发控制人形机器人运动的“小脑”,搭建运动控制算法库,建立网络控制系统架构。
一道是成本关。目前,我国人形机器人市场已出现一些轻量化低成本产品,如宇树科技发布的人形机器人G1量产版售价9.9万元起。不过,市面上绝大多数人形机器人售价在几十万元到上百万元不等。“从供应链上看,要突破核心零部件制造难题、实现低成本,还是要依靠我国的制造基础。”浙江人形机器人创新中心首席科学家熊蓉说。
文章来源:科技日报