你相信AI能够操作你的电脑吗?

秘密课程 2024-10-29 18:44:49

远程控制并非一项崭新的技术,它是借助 TCP/IP 网络协议得以实现的一种功能。远程控制采用获取对方的 token、加密协议以及 IP 来进行鉴权的技术方案。不管是黑客还是所谓的 “白客”,皆通过获取对方的 IP 以及最高权限(root 权限)来达成对他人电脑的远程控制。

当前,在历经深度学习、机器学习、监督学习、卷积神经网络等一系列技术的演进之后,多模态、多模态 RGA、端到端、prompt、AGI 等与人工智能相关的技术名词正逐步被大众所熟知。

人工智能的发展可谓历经坎坷。从最初基于数值计算的人工智能形态,发展至以大数据为基础、以监督学习和神经网络等智能算法为辅助的专家系统级别的人工智能,再过渡到如今以端到端、多模态为根基的生成式人工智能。其中,以 ChatGPT 的火爆为标志,随着时间的推移,又衍生出以视频生成为主的大模型 Sora,以及以替代软件工程师为目标的 Devin。这些落地的人工智能工具在一定程度上为人们的生活带来了便利。于是,完全由 AI 操控你的电脑,实现不敲一行代码、3 分钟搞定一个网站的设想,终于在某一天的夜晚应运而生,它便是 ——Claude。

AI 仅仅是一个工具,而 Claude 则犹如一个百宝箱。Claude 3.5 的诞生将彻底变革 AI Agent 的游戏规则,它是由 Anthropic AI 发布的。为何 Claude 3.5 能够实现 “像人一样使用电脑” 呢?这是因为 Claude 3.5 Sonnet 具备一项具有突破性的全新能力 ——“Computer use”。开发者可以通过 API 指示 Claude 像人一样使用计算机,包括观察屏幕、移动光标、点击按钮以及输入文本等。在实现该功能的过程中,Anthropic AI 尝试了一种新的方法:并非为 Claude 创建特定的工具来完成单独的任务,而是教会它通用的计算机技能,使其能够使用一系列为人类设计的标准工具和软件程序。

基于这样的设计理念,Anthropic AI 构建了一个 API,使得 Claude 能够感知并与计算机界面进行互动。开发者可以集成该 API,让 Claude 将指令转化为计算机命令,实现任务的自动化和智能化。

目前,这项技术处于公测阶段,并且 Claude 3.5 是业内首个在公测阶段提供 “Computer use” 功能的前沿 AI 模型。不过,切不可因此而急于解雇员工,因为此阶段仍处于实验阶段,偶尔可能会显得笨拙且容易出错。

尽管如此,人们对 “Computer use” 的前景满怀期待,并相信它将随着时间的推移迅速得到改善。据悉,目前 Asana、Canva、Cognition、DoorDash、Replit 和 The Browser Company 等公司已经开始探索 Claude 3.5 Sonnet 的可能性,尝试让其自动执行需要数十甚至上百个步骤才能完成的任务。

正如 Anthropic 所说,这项尚处于起步阶段的技术将从初步部署中不断学习并进步。因此,实现不敲一行代码、3 分钟搞定一个网站的设想还是很有希望实现的,同时也期待这些发展为人们带来更多人工智能应用的可能性。

0 阅读:7