OpenAi与谷歌相继发布新品,AI战火重新点燃

宁静致远零二 2024-05-18 05:39:01

5月14日凌晨,OpenAI发布了新一代多模态人工智能(AI)大模型GPT-4o。谷歌随后一天,紧跟OpenAI的脚步,在15号携新版Gemini AI大模型等尖端产品重装上阵,正面对决OpenAI,新一轮AI战火再次被点燃。

GPT-4o是一个“原生多模态”模型,它可以接受文本、音频和图像任意组合的输入,并生成这些格式的相应输出,能够处理50种不同的语言,速度和质量同时得到提高。它可以在短短232毫秒内处理音频输入,平均耗时320毫秒,在与人类对话中,反应时间相当迅速。从发布会现场的演示来看,GPT-4o是如此的丝滑。

谷歌Gemini模型驱动的AI助手Astra对标Sora的文生视频模型Veo。Astra的目标是创建“通用人工智能代理”的尝试。与GPT-4o一样,Astra具有以各种形式或多模式方式快速响应用户的卓越能力,这使得它非常适合成为AI助手。谷歌表示,Astra可以创建事件时间轴并缓存信息,更快速的被调用。AI能看、能听、能说,甚至能回忆。

两家AI公司,相继发布大模型,从应用上,都达到了一个新的水平。但从根本上,还是对原有技术的一个深度整合,技术上貌似没有太大的突破。无非就是把音频、视频、文本的功能整合在了一起。对原来只能完成单一功能的GPT来了个升级。使得一个GPT既能看,又能听,还能说。但底层的计算、推理能力应该还是停留在之前的水平。就算有所提升,应该也不太大。

自从chatGPT在2022年11月25日发布开始,谷歌和OpenAI就展开了激烈的争斗。现在两家公司纷纷亮相新品,引人瞩目。但是,生成式AI的发展还远没有达到人们的预期。随着时间的流逝,和大家对AI产品的不断体验。生成式AI所产生的错误问题也不断的被暴露出来。

毕竟生成式AI领域相对还是一个新生的事物,很多人还抱着谨慎的态度来看待AI的发展。而同时,各大AI公司目前所争夺的目标也不是市场份额和用户的忠诚度。而仅仅只是在秀肌肉。

chatGPT在过去两年的声势尽管很大,但真正使用的人其实不是很多。虽然在发布之初,短短一个月不到的时间就用户量达到了过亿的级别。但是,在现实生活和工作中,除了一些经常接触网络的人之外,对GPT了解的人相对还是不多。更不用谈使用GPT的人了。据美国的一家研究中心发布的调查数据显示,在美国也只有百分之二十三的成年的使用过GPT。能持续或经常使用的人,这个比例应该会更低。

而AI技术到底能给我们的生活和工作带来多大的影响,目前还没有人能给出确切的答案。尽管现在失业率很高,很多人将如此高的失业率归咎于AI的发展,但实际上真正因为AI的发展而失业的人并不是很多。要说影响最大的行业也只是在互联网行业。但是,互联网行业的高失业率也是由综合因素导致的,不能完全归咎于AI的发展。

太多太多的人根本就没体验过生成式AI工具,我们有理由相信,生成式AI的最终发展,很有可能不会像很多人说的那么具有革命性。生成式AI不太可能成为新一次工业革命的导火索。

0 阅读:0