三年之后,世界上最流行的编程语言是什么?
大概率不是Python、不是Java Script,而是英语。
最近在AI圈有一款IDE、编程软件超火,叫Cursor。你用过之后,估计也会有这样的想法。
我把Cursor看作是VS Code的终极进化版。它是VS Code的fork版本,各种功能基本一样,可以无缝导入过来。但是,在AI方面,Cursor就做得好多了。它不是像GitHub Copilot那样,以插件的形式植入进去,而是原生地、天然地支持——这一点非常重要,会带来质的不同。
在模型方面,Cursor很大方:你可以用它的模型,一个月订阅费用是20美金,也可以用你自己的模型,填入API Key就行。甚至,它还允许你用GitHub Copilot,不过它会提示你,不建议使用,因为性能上不如它的东西啦。
上个周末,我集中测试了一下Cursor。最好的一次,只花不到10分钟,不写任何一行代码,就是跟AI纯聊天,就开发出一个Chrome浏览器插件,能调用GPT去总结网页内容。
这10分钟的前3分钟,我用来写需求:
我希望开发一个浏览器插件,主要功能是用大模型总结网页。它会先做Scraping,也就是把网页内容都扒下来。然后把这些内容给到模型,按照Summary、Key Facts的格式输出。
在具体功能方面,插件上有三个按钮:Summarize就是总结。Settings就是设置,会要求用户输入OpenAI的API Key。插件先去确认这个Key是否可用。如果可以,就把可以使用的模型以列表都拉过来,让用户选择、保存。Clear就是清除上一次的总结结果,或者中断当前的总结任务。
当我在Word上把这些都写完之后,复制下来,打开Cursor,通过控制面板打开聊天界面,全部粘贴进去。接下来的体验跟咱们使用ChatGPT、Claude基本一样:
Cursor的反馈速度非常快,只用几秒钟就理解、拆解了需求。它告诉我们,要创建哪几个文件,每个文件的名称和代码都给到了。这时,我们只需要根据指示把文件创建好,把对应的文件开着,然后点击Apply,AI会把代码填进去。
Apply功能特别方便。因为在debug过程中,肯定要修改代码。Cursor不会把代码全部生成一遍——那就太慢、太消耗token了。所以,它只会输出需要修改的那几行。
这时候,压力就给到用户这边了——因为要在几百行代码里边找到要修改的地方,还是挺费神的。所以,Apply功能会自动找到修改位置,用红色标注出原来的代码,用绿色标注出建议的代码,用户确认之后,它再自动替换。
等我们把所有代码都贴进文件里,就可以测试了。
打开Chrome浏览器的插件页面,进入开发者模式,打开代码所在的文件夹,就可以加载插件。
第一次测试肯定会有Bug。这边我们发现,Settings按钮没反应。很简单,回到Cursor里边,把问题告诉AI,然后把新生成的代码通过刚才说的Apply功能替换进去。
刷新插件,现在可以打开设置页面了。填入API Key,就像需求里说的那样,插件会先Verify一下,然后把Model List拉出来。这时会发现,List不全,只有两个模型,我猜是Cursor自作主张预设了,并没有真的去拉取。另外,点击Summarize并没有正常工作,只是显示了一个demo。
所以再次跟Cursor沟通,把这两个问题反馈了。像这样的debug过程会经常遇到。不过这一次挺幸运的,只来回处理了两趟。
再次刷新插件、重新测试。这下可以看到,模型列表正确显示出来了。点击Summarize,插件开始工作。等个几秒钟,成功总结出来了。为了确认真的可以用,我又找了两个网页,也都总结成功了。
我看了一眼时间,从写需求到测试成功,大概10分钟。这不是我第一次这么干。其实前一天也试过,不过不太成功,过程让我有点崩溃。
每一次修改代码都会带来新的Bug。我眼睁睁看着原本只有30行的代码膨胀了10倍,变成300多行,而且问题还没解决。
后来我心想,要不换个实现方式,改用多模态。先把整个页面截图下来,再给到GPT去识别和提取。结果还是不行。反正折腾了快一个小时。
到了第二天,我反思了一下。其实这个插件的工作流程就两步:先Scrape,再Summarize。之前我自己写Agent Workflow的时候就是这么处理的。于是我把需求改了一些,产品经理的活儿我干了,Cursor就专心Coding。果然,效果立竿见影。成功那一刻的快感,跟游戏通关差不多。
这款总结插件还很粗糙。如果要做到能上架的程度,可能还需要投入点时间:
第一,它的Scraping比较简单,还可以再强化,这样才能应对更多的网页。
第二,它的总结还不够好。这个调整起来很简单,不需要AI修改,我直接在提示词那边做详细要求就可以。
第三,现在只支持OpenAI,可以把Google、Anthropic等等都加上。
第四,把UI弄得好看一点。这个也简单。我找个别人的产品,截图下来给到AI,它肯定能照着做出来。
这四个要改进的地方,顺利的话,我估计再花个半小时应该能完成。全部搞定之后,就可以提交给Google审核、然后上架了。
我不喜欢说什么“未来已来”这种话,但是,Cursor给我的震撼是远超两年前的ChatGPT的。可能是因为,ChatGPT做的都是我会的东西,不就是生成一些文字嘛,而且还没我干得好。所以它带给我的只是一种新鲜和惊讶。
但是Cursor不一样。像开发一款浏览器插件这种事儿,我是完全不会,更别提在10分钟之内把原型搞定。所以这是一种震撼——它给了我完全不具备的新技能。我觉得,这个才是AI的真正价值。
今天很多人,尤其是国内的很多老板认为,AI就是用来降本,用来替代员工,成为裁员的借口。他们是把人力看做成本。他们眼中的世界是有限的,就这么点地方,所以得到处节省。
但其实,这个世界可以不是一个“有限游戏”,是可以变成“无限游戏”的。AI赋予个体从没有过的技能,或者把个体原有的技能放大好几倍。去满足更多,去创造更多,这不是更美好吗?
对我来说,如果要开发个小工具,可以在Cursor的帮助下直接完成。如果稍微复杂一点,那我也可以先做个原型出来,再花钱找前端和后端帮我完善。
突然感觉,我的整个世界变得好宽阔。也许到明年,我给到大家的,不只是这样的视频和文章,还有更多形态,可以是网页,可以是APP,甚至可以是一个小模型。我太期待了!