我开始用AI来做投资分析了|方法论

海云聊商业 2024-03-28 22:44:51

(文末照例有一张图总结)

大家好,我是很帅的狐狸

今天我准备来聊聊

如何用生成式AI做研究

最近,我在网上刷了一堆「教你怎么用AI赚钱」的视频。

如果照着他们去做,比如去批量制作短视频什么的,或者批量出插画,最后你会发现压根就没人愿意买单。

也有人尝试让ChatGPT给投资建议,基本上跟去赌场没什么区别。

最后真正赚钱的,就只有那些教人用AI赚钱的。

面对新事物,如果已经错过了信息套利的红利期,现在就不要想着怎么去捞偏财了。

反而应该集中精力研究看看,怎么把生成式AI用在自己的主业里。

所以今天我打算聊聊,怎么在投资分析使用ChatGPT等生成式AI。

文章有点长,但干货很多,建议收藏分享。

顺带一提:本文不会分享如何用上ChatGPT。

毕竟目前已经有很多镜像站(比如Poe之类的App),另外New Bing背后也是GPT-4,都是挺好的平替。

稍微搜搜网上还是挺多教程的。

Part 1 一个有意思的案例

我还在麦肯锡做咨询时,面试小朋友时,经常会问他们市场规模测算的问题——

比如让他们在无法访问网络的情况下,估算一下香港有多少个自助取款机,或者是估算一下上海每年能卖出多少杯咖啡。

这种问题,一方面是考察逻辑分析能力,另一方面则是考察商业常识。

然后某天,我心血来潮,让ChatGPT估算,北京市每年可以卖出多少平方米的地毯。

它给了一个令我很满意的答案——

有一点挺出乎我意料的:它可以意识到地毯满足的需求是以家庭为单位,而不是以个体为单位。

所以它一开始就估算了北京的家庭数量,而不是按人口数量来进行估算。

不过,它在估算过程中遗漏了对商用地毯的评估,于是我进一步对它进行提问。

它也进行了补充——

可以说,在市场规模测算这事上,ChatGPT已经不输那些到麦肯锡面试的应届生们了。

如果可以接入实时数据库的话,甚至可以让它直接帮你把测算模型给搭好。

所以当我完成了上述提问后,我就决定:以后所有的研究分析工作中,我都要尽可能地用上它。

在这个过程中,我做了很多尝试,慢慢梳理了在各个研究环节中ChatGPT是如何发挥作用的。

Part 2 研究产出的成果

做研究,关键是要得出一个结论、一个观点。

以投资研究为例,一般我们需要得出结论,判断某个股票或债券该不该买,或者说目前比较合适的资产配置应该是怎样的分布等等。

结论需要有论述作为支撑,而论述又需要有事实的支撑。

所以一般做研究,产出的成果,往往是一个结构稳固、逻辑自洽的「金字塔」——

这个是《金字塔原理》一书所描述的。

举个例子,我们在之前给大家聊到今年金价的走势时,就搭过一个金字塔——

回顾我们的文章,你会发现长一点的文章,基本上都是这样的结构。

这种金字塔,就是我们做研究分析后的核心产物。

每个金字塔都是非常稳固的结构:只要支持内容是事实,关键论述就会成立;只要关键论述都成立了,核心观点也大概率是靠谱的。

那么问题就来了——

如何通过研究来构建金字塔呢?

一般有两种方式:自上而下,以及自下而上。

Part 3 利用AI构建金字塔

我们来看看,生成式AI在这两种构建金字塔的过程中,能怎么帮到我们。

方式1:自上而下

理工科出身的读者可能比较熟悉这个方式。

我们直接上一个栗子——

比如说2018年的时候,不少人观察到的「消费降级」现象(当时带火了涪陵榨菜、桃李面包等票)。

敏锐的投资者会思考这个现象是否可以持续,所以找到消费降级背后的原因很重要。

我们可以选择做一个非常详细的问卷,调查消费者生活方方面面的变化;也可以选择组织几场聚焦访谈,让消费者们畅所欲言;甚至可以选几个消费降级的人,(征得同意后)24小时观察他们的生活观察上几个月…

另一个选择是,我们照着前面的「三部曲」,先第一步——做假设。

消费降级,本质上就是不花钱了。

通常要么是能力问题(真没钱了),要么是意愿问题(欲望少了)。

我们先假设主要是能力问题。

接着第二步——找支撑。

我们可以开始思考:要论证消费者手上没钱了,我们可以在哪些方面找支撑?

最后第三步是挖事实。

我们可以根据我们想要证明的论述,找到可以支撑的事实或数据。

找到各个数据后,我们就可以证实或证伪一开始提出的假设了。

而生成式AI,在这三个步骤中都可以帮到我们——

在第一步的「做假设」阶段,比如我想研究碳酸锂的价格下跌的原因,它可以帮我发散思维,作出一些初步的合理解释。

同样的问题我也抛给了百度的文心一言,不过有些假设并不是特别合理——

而在第二步的「找支撑」阶段,生成式AI则可以帮我们建立分析框架——

同样的问题我也抛给了文心一言——

至于第三步「挖事实」,如果你没充值的话是用不上联网的ChatGPT的,这也意味着它只能访问2021年9月以前的数据。

文心一言虽然可以联网,不过会有一些逻辑错误,需要我们仔细甄别……

相比之下,New Bing会好用很多:因为它会列出数据来源,我们可以很快进行事实查证,看看它的回答是不是靠谱。

另一方面,生成式AI还可以在这个步骤帮我们挖掘数据源(虽然部分网址有点问题)。

整体对效率还是有提高的。

接着我们来看看——

方式2:自下而上

同样的,我们直接上一个栗子——

我的朋友Xixi有个业务是放贷给地产公司,我以这个为背景,做了个案例。

假设我给她写了这么一封email——

看完这封email,其实大部分人都没办法记得住什么——

我就是罗列了一大堆事实,但是这些事实在罗列过程中并没有什么逻辑。

而自下而上地去构建金字塔,就是要在一堆散乱的事实中去提炼一个核心观点。

首先是第一步,列发现。

我们可以把email里头那些事实一个个写在便签纸上。

接着是第二步和第三步,找规律+提要点。

其实就是做归纳总结,按某个合乎逻辑的标准,把同类项给归到一起,并提炼一下关键的论述。

比如前面的例子中,我们可以分成这三个关键论述——

如果你比较熟悉会计的话,应该知道我们是按现金流的类型把问题进行了分类——分别对应融资现金流、投资现金流以及运营现金流。

而这家公司三种类型的现金流都不大给力。

所以我们在进行第四步提炼核心观点的时候,也不难得出结论——

按照上面的金字塔,我们可以把前面的email重新组织一下——

你会发现整封email的逻辑变得特别清晰,你也更容易记住里头的关键信息点。

这就是金字塔的好处。

而生成式AI,在前面的四个步骤里头,也可以很好地帮到我们。

在第一步列发现阶段,你可以直接把内容丢给ChatGPT进行提炼。

这可能也是不少做投资研究的人的基本操作了——

在第二步和第三步找规律+提要点,你会发现ChatGPT这方面的能力还是相对欠缺,它没办法对分类做到MECE(不重不漏)。

比如前面的案例中,其实借款困难、上市失败、信任受损等结论,都可以算是财务状况的一部分。

不过我也惊喜地发现,只要稍微给它一点提示,它也可以把任务完成得很好——

相比之下,文心一言这方面的能力似乎还有待提高——

而在最后一步提炼核心观点环节,ChatGPT的表现也是超出了我的预期——

相比之下,文心一言对角色的判断还不是很准确。

Anyway,至少从效率提升的角度来看,生成式AI确实有点用处。

那么下一个问题就来了——

Part 4 GPT可以替代分析师吗

从目前的技术水平来看,即使是行业领先的GPT-4模型,在做投资分析时,仍然存在着几个方面的挑战——

挑战1:框架感不大好

比如前面提到的,在分类的时候,ChatGPT的框架还是没办法做到很MECE(不重不漏)。

挑战2:时效性限制

即使目前GPT-4可以联网了,但也解决不了数据口径问题。

比如中国有一个很重要的宏观经济数据——社会融资规模,它的口径隔三岔五就会改一次。

如果你用2023年的数据跟2018年的数据做对比,口径都不一样,自然没办法得出有效的结论。

而生成式AI在这方面的区分上暂时还存在挑战。

挑战3:复杂口径

有些数据口径非常复杂,光是看字面意思都很难彻底搞懂。

做分析的时候,很多时候会遇到只有业内比较资深的分析师才知道的细节。

比如央行每个月都会公布两个「人民币贷款」数据——

很多读者问过我这两个到底有什么区别,为啥对不上。

比如一季度的这两个数字,一个是10.6万亿,一个是10.7万亿。

字面意思来看,后者是「对实体经济发放的人民币贷款」,那么人民币贷款除了给到实体经济,还能给到谁呢?

其实会给到其他的金融机构,比如保险公司、证券公司等等。

所以10.6万亿的那个数据,其实是更大的范围的口径,是银行发放给「实体经济+非银行类金融机构」的人民币贷款。

但你会发现,这个口径的数值居然比发放给「实体经济」的那部分还要小0.1万亿。

其实这是因为,这个数据是「净增量」的概念——

换句话说,一季度银行从非银行类金融机构手头上,还回收了0.1万亿。

这种细节对于ChatGPT来说,也存在一定挑战。

挑战4:提炼深度不够

我们先来理解一下什么是「提炼深度」。

直接上一个栗子——

比如现在有3个未经加工、未经排序的事实——

① 我把钥匙不知道放哪儿了

② 我以为护照在那儿,但没有

③ 我两个月没递交纳税申报表了

我曾经让不少应届生对上面这三点进行提炼(你们也可以尝试下)。

有不少人给到我的答案,是类似下面这样——

「我丢了钥匙和护照,而且我延误了报税」

这个并不是一个有用的「提炼」,充其量只能算是「总结」。

说得更直白一点,就只是做了小学生都能做到的「缩句」而已。

而真正有意义的提炼,是光看那三句话没办法直接知道的,比如——

「我最近什么事情都做不好」

而且我们可以通过不断问自己「So what」(那又怎样),推着自己去思考,从而得到更有深度、更能指导行动的提炼——

一开始,我觉得这个限制会是生成式AI最大的问题。

但我试着提问了它们后,又发现好像它们比那些应届生的表现好得多……

当然,包括前面提到的三个挑战,其实我们也可以通过不断喂它数据、训练它来进行修正。

从这个角度来看,它已经可以完全替代掉初级的咨询顾问了。

当然,它终究还是没办法彻底替代掉分析师们的。

毕竟报告还是需要人来签字,出了问题才有人来背锅。

而AI,暂时还没能力替我们去坐牢。

最后照例来个一张图总结——

P.S. 如果喜欢这类方法论文章,给我点动力,点个在看点个赞呗。

「Greed is good.」

「很帅的投资客」的所有内容皆仅以传递知识与金融教育为目的,不构成任何投资建议。一切请以最新文章为准。

⚠️ 风险提示:OpenAI删账号;文心一言迭代速度不及预期。

相关阅读:

《中文AI,真的不行?》《境内可用的AI分析工具》《被AI“割韭菜”?值吗?》《死亡与人工智能》《ChatGPT的一些新变化》《ChatGPT来了,你焦虑吗?》《如何让思考更结构化?| 很帅的方法论》

图文/ 狐狸

Icon/ freepik from flaticon

主创/ 肖璟,@狐狸君raphael,曾供职于麦肯锡金融机构组,也在 Google 和 VC 打过杂。华尔街见闻、36氪、新浪财经、南方周末、Linkedin等媒体专栏作者,著有畅销书《风口上的猪》《无现金时代》。

0 阅读:0