近期大模型的一些思考(转1王小川6月去了硅谷,带回来的信息是国外大模型技术从

暗夜滚雪球 2023-08-18 14:08:47

近期大模型的一些思考(转

1 王小川6月去了硅谷,带回来的信息是国外大模型技术从领先半步到领先一步,国内大模型应用从领先半步到领先三步。说明中美技术差距还是很大的,过去预测是6个月,现在看要1年左右。国外的大模型行业应用以甲方为主,例如在金融行业,摩根大通有1500数据科学家在做大模型在金融行业的应用。中国大模型应用以乙方和创业公司为主,甲方的技术团队在大模型领域还是缺人才,缺算力,更多依靠乙方(大型科技企业和创业公司)

2 me­ta的开源大模型LL­a­MA(羊驼)家族正在成为主流开源模型(性价比高),但是在NLU方面,效果还是落后于Op­e­n­Al的GPT系列。行业大模型是个大市场,但是都是处于探索阶段,现在是取得了比原来传统模型好的效果,但是达不到类似GPT的智力涌现的效果,可以说行业大模型还有很长的路要走,至少要一年左右,行业大模型的商业价值涌现要到2024年

3 Op­e­n­Al发现,在GPT4.0之后,仅仅增加的数据和训练无法提升模型的准确度,也无法带来新的智力进化,GPT未来需要在算法上进行突破(这也给了行业追赶的时间)。Op­e­n­Al在工程上进行大量投入,在建立基于1000万张GPU卡的超级大模型(英伟达2023年的 GPU产量165万张,高端卡20万张)。如果OP­E­N­AI的这个目标实现了,会不会带来意外的惊喜,超级大模型会不会成为超级人工智能大脑来控制一切?(类似于终结者中的天网)

4 美国很多大企业在同时使用GPT大模型和其他开源大模型,目前从效果上看还是GPT效果要好很多,GPT3.0之后不再开源,其他大模型何时可以达到GPT的效果还是未知,中国的大模型预计2024年可以达到GPT4.0的效果(乐观预测)

5 全世界AI前2000的人才,以中美为主,美国是中国的2倍到3倍,美国的大模型人才集中在三大高科技企业go­o­g­le,me­ta,微软,其中 Go­o­g­le是微软和me­ta总和的近两倍,中国集中在高校,清华,浙大,北大,中科大等,其中清华最多,是浙大和北大的总和,阿里是中国企业中拥有项级A人才最多的企业,排行第五,仅落后干中科大

6 大模型领域的商业价值,唯一确定的领域是算力,未来算力也是核心投资领域之一。其他应用的商业价值主要集中在生物科学的蛋白质结构预测(al­p­h­a­f­o­ld)和程序员辅助co­p­i­l­ot(Co­d­ex)等,其他的商业领域还在摸索中,智能客服是个确定领域,但是商业价值不明显,te­x­t­t­o­l­m­a­ge,是个确定领域,带来的主要是效率提升,离商业价值的直接变现还有距离。大模型商业变现有个问题,大模型作为生产环节的一部分,间接参与生产,主要作用还是效率的提升,很难从ROI的角度看到其明确的可衡量的价值。未来还需要在更多的业务领域中,挖掘大模型的商业价值,预期要1年左右,才可以明确。未来有可能需要软硬件结合(类似于现在的工厂的AI质检),参与社会化大生产中的某个环节(体育新闻撰写,内容推荐引擎,医疗图像诊断等具体分工)或者单独依靠计算(商业模型计算等)来体现其价值,应用的路还有些长

7 大模型的惊喜是带来智力涌现,离我们预期的先知越来越接近。未来人类主要的任务是从大模型里提取出智力,协助我们进行决策,其中领域大模型的Ag­e­nt和通用大模型的Pr­o­m­pt能力显得很重要。领域数据会成为大模型领域的另外一个核心竞争力。

2 阅读:2888

评论列表

诚信小本买卖

诚信小本买卖

10
2023-08-19 07:29

这种情报才是有用的,知已知彼

攻玉

攻玉

3
2023-08-19 20:23

这么多数据怎么比较的?这个量化比较有点复杂吧,不知道谁有这个能力轻易下结论[得瑟][得瑟]

用户10xxx11

用户10xxx11

2
2023-08-19 13:04

chat gpt离真正的人工智能还有十万八千里远!

蹩脚禪师

蹩脚禪师

1
2023-08-19 07:26

华为表示,你们都是垃圾!

A胡宾 回复 08-20 00:33
华为不敢表示

霍达克

霍达克

1
2023-08-19 14:34

人工智能的真正意义在于以规模生产方式生产知识、生产技术、生产创造创新,甚至生产科学。

五柳2013

五柳2013

1
2023-08-20 10:15

为小编点个赞

暗夜滚雪球

暗夜滚雪球

感谢大家的关注