近期大模型的一些思考(转
1 王小川6月去了硅谷,带回来的信息是国外大模型技术从领先半步到领先一步,国内大模型应用从领先半步到领先三步。说明中美技术差距还是很大的,过去预测是6个月,现在看要1年左右。国外的大模型行业应用以甲方为主,例如在金融行业,摩根大通有1500数据科学家在做大模型在金融行业的应用。中国大模型应用以乙方和创业公司为主,甲方的技术团队在大模型领域还是缺人才,缺算力,更多依靠乙方(大型科技企业和创业公司)
2 meta的开源大模型LLaMA(羊驼)家族正在成为主流开源模型(性价比高),但是在NLU方面,效果还是落后于OpenAl的GPT系列。行业大模型是个大市场,但是都是处于探索阶段,现在是取得了比原来传统模型好的效果,但是达不到类似GPT的智力涌现的效果,可以说行业大模型还有很长的路要走,至少要一年左右,行业大模型的商业价值涌现要到2024年
3 OpenAl发现,在GPT4.0之后,仅仅增加的数据和训练无法提升模型的准确度,也无法带来新的智力进化,GPT未来需要在算法上进行突破(这也给了行业追赶的时间)。OpenAl在工程上进行大量投入,在建立基于1000万张GPU卡的超级大模型(英伟达2023年的 GPU产量165万张,高端卡20万张)。如果OPENAI的这个目标实现了,会不会带来意外的惊喜,超级大模型会不会成为超级人工智能大脑来控制一切?(类似于终结者中的天网)
4 美国很多大企业在同时使用GPT大模型和其他开源大模型,目前从效果上看还是GPT效果要好很多,GPT3.0之后不再开源,其他大模型何时可以达到GPT的效果还是未知,中国的大模型预计2024年可以达到GPT4.0的效果(乐观预测)
5 全世界AI前2000的人才,以中美为主,美国是中国的2倍到3倍,美国的大模型人才集中在三大高科技企业google,meta,微软,其中 Google是微软和meta总和的近两倍,中国集中在高校,清华,浙大,北大,中科大等,其中清华最多,是浙大和北大的总和,阿里是中国企业中拥有项级A人才最多的企业,排行第五,仅落后干中科大
6 大模型领域的商业价值,唯一确定的领域是算力,未来算力也是核心投资领域之一。其他应用的商业价值主要集中在生物科学的蛋白质结构预测(alphafold)和程序员辅助copilot(Codex)等,其他的商业领域还在摸索中,智能客服是个确定领域,但是商业价值不明显,texttolmage,是个确定领域,带来的主要是效率提升,离商业价值的直接变现还有距离。大模型商业变现有个问题,大模型作为生产环节的一部分,间接参与生产,主要作用还是效率的提升,很难从ROI的角度看到其明确的可衡量的价值。未来还需要在更多的业务领域中,挖掘大模型的商业价值,预期要1年左右,才可以明确。未来有可能需要软硬件结合(类似于现在的工厂的AI质检),参与社会化大生产中的某个环节(体育新闻撰写,内容推荐引擎,医疗图像诊断等具体分工)或者单独依靠计算(商业模型计算等)来体现其价值,应用的路还有些长
7 大模型的惊喜是带来智力涌现,离我们预期的先知越来越接近。未来人类主要的任务是从大模型里提取出智力,协助我们进行决策,其中领域大模型的Agent和通用大模型的Prompt能力显得很重要。领域数据会成为大模型领域的另外一个核心竞争力。
诚信小本买卖
这种情报才是有用的,知已知彼
攻玉
这么多数据怎么比较的?这个量化比较有点复杂吧,不知道谁有这个能力轻易下结论[得瑟][得瑟]
用户10xxx11
chat gpt离真正的人工智能还有十万八千里远!
蹩脚禪师
华为表示,你们都是垃圾!
A胡宾 回复 08-20 00:33
华为不敢表示
霍达克
人工智能的真正意义在于以规模生产方式生产知识、生产技术、生产创造创新,甚至生产科学。
五柳2013
为小编点个赞