在当今这个时代,AI 的发展可谓是如火如荼。只要打开新闻,满屏皆是关于 AI 荣获诺贝尔奖以及马斯克无人驾驶汽车的报道。然而,对于我们这些普通大众和创业者而言,这些看似高大上的科技成果仿佛遥不可及。那么,在这股 AI 的浪潮中,是否存在一些我们能够理解并把握的机会呢?
未来 AI 的大方向正变得愈发清晰,其中有三个关键要点,而这三个要点,谷歌前 CEO 艾瑞克·施密特在斯坦福大学的演讲中就有所提及。
在接下来的一年里,我们将会目睹更大规模的上下文窗口、(AI)Agent和Text-to-Action 功能的广泛应用,其产生的影响甚至会远超当下社交媒体所带来的冲击。
首先,我们来谈谈更大规模的上下文窗口。用通俗的话来讲,就是拥有更出色的记忆能力。比如说,当您使用 AI 看医生时,医生会询问您一系列问题,如年龄、体重、饮食习惯、有无慢性病、是否容易疲劳出汗等,您花费了半小时详细回答。然而,两周后复诊,当您提及上次的治疗效果和出现的新问题时,医生却好像完全不记得之前的对话,再次要求您回答那些基础信息。
在很多人工智能应用开发的过程中,发现要提供优质服务,工作记忆往往是最为缺失的一环。因此,增强 AI 应用的工作记忆就显得至关重要。无论是医疗诊断,还是旅行攻略、购物推荐等服务,不仅要记住并处理您两周前的答案,甚至要记得您两年前的回答,从而为您提供无需重复回答就能享受到的更连贯、更个性化的服务。这种更大规模的上下文窗口,其核心价值就在于能够给予用户更精准、更贴合个人需求的服务。
其次,是 AI Agent,简单理解就是更能干的助理。比如您计划去西双版纳旅游,当您向手机里现有的助理提出一系列复杂的需求,如订一间离机场近、价格在 300 至 500 元之间的大床房,还要帮您在微信发朋友圈宣告度假行程,它可能会感到力不从心。因为这不仅涉及到自身的理解和决策能力,还面临与其他 APP 如酒店 APP、社交 APP 等的数据接口调用和系统协作的难题。
所以,AI Agent要解决的重要问题之一就是协作。通过更有效的打通和调用,打破过往 APP 之间的数据孤岛状态,实现自由自主的交互与协作,从而能够代表用户完成更多复杂的任务。AI Agent 的核心价值在于能够与外部系统协同合作,为用户提供更复杂、更便捷的服务。
最后,是Text to Action,通俗地说就是更有执行力的服务。前谷歌 CEO 施密特在演讲中举例,未来每个人都可能拥有专属的程序员,能够完全按照指令行事。但这其中的关键并不仅仅是听话和执行,还在于是否具备领域智能,也就是它是否能理解具体应该怎么做。
以自动驾驶为例,当您坐上无人驾驶汽车并说出目的地“东方明珠”,车辆要想安全送达,面临的问题众多。比如,何时转向、转向角度多大、何时踩油门、何时刹车等等。过去,车辆可能像机器一样依据程序和规则驾驶,而如今有了端到端的视觉智能,它可以像经验丰富的老司机一样根据学习到的大量驾驶视频中的经验来操作。
Text to Action 主要解决的是执行问题,关键在于不仅要听话照做,还要拥有领域智能,清楚知道如何达成目标。其核心价值在于能够将输入的文本指令直接转化为具体的实际动作或流程,提供更高效、更落地的服务。
掌握人工智能就如同学习一门语言,需要花费时间去沉浸和钻研。而年轻人最大的优势在于拥有充足的时间去深入了解,养成对人工智能的深刻认知。未来的竞争归根结底是认知的竞争,只有提前看懂、提前准备,才能在时代的浪潮中占据先机。