OpenAi与谷歌相继发布新品，AI战火重新点燃

5月14日凌晨，OpenAI发布了新一代多模态人工智能(AI)大模型GPT-4o。谷歌随后一天，紧跟OpenAI的脚步，在15号携新版Gemini AI大模型等尖端产品重装上阵，正面对决OpenAI，新一轮AI战火再次被点燃。

GPT-4o是一个“原生多模态”模型，它可以接受文本、音频和图像任意组合的输入，并生成这些格式的相应输出，能够处理50种不同的语言，速度和质量同时得到提高。它可以在短短232毫秒内处理音频输入，平均耗时320毫秒，在与人类对话中，反应时间相当迅速。从发布会现场的演示来看，GPT-4o是如此的丝滑。

谷歌Gemini模型驱动的AI助手Astra对标Sora的文生视频模型Veo。Astra的目标是创建“通用人工智能代理”的尝试。与GPT-4o一样，Astra具有以各种形式或多模式方式快速响应用户的卓越能力，这使得它非常适合成为AI助手。谷歌表示，Astra可以创建事件时间轴并缓存信息，更快速的被调用。AI能看、能听、能说，甚至能回忆。

两家AI公司，相继发布大模型，从应用上，都达到了一个新的水平。但从根本上，还是对原有技术的一个深度整合，技术上貌似没有太大的突破。无非就是把音频、视频、文本的功能整合在了一起。对原来只能完成单一功能的GPT来了个升级。使得一个GPT既能看，又能听，还能说。但底层的计算、推理能力应该还是停留在之前的水平。就算有所提升，应该也不太大。

自从chatGPT在2022年11月25日发布开始，谷歌和OpenAI就展开了激烈的争斗。现在两家公司纷纷亮相新品，引人瞩目。但是，生成式AI的发展还远没有达到人们的预期。随着时间的流逝，和大家对AI产品的不断体验。生成式AI所产生的错误问题也不断的被暴露出来。

毕竟生成式AI领域相对还是一个新生的事物，很多人还抱着谨慎的态度来看待AI的发展。而同时，各大AI公司目前所争夺的目标也不是市场份额和用户的忠诚度。而仅仅只是在秀肌肉。

chatGPT在过去两年的声势尽管很大，但真正使用的人其实不是很多。虽然在发布之初，短短一个月不到的时间就用户量达到了过亿的级别。但是，在现实生活和工作中，除了一些经常接触网络的人之外，对GPT了解的人相对还是不多。更不用谈使用GPT的人了。据美国的一家研究中心发布的调查数据显示，在美国也只有百分之二十三的成年的使用过GPT。能持续或经常使用的人，这个比例应该会更低。

而AI技术到底能给我们的生活和工作带来多大的影响，目前还没有人能给出确切的答案。尽管现在失业率很高，很多人将如此高的失业率归咎于AI的发展，但实际上真正因为AI的发展而失业的人并不是很多。要说影响最大的行业也只是在互联网行业。但是，互联网行业的高失业率也是由综合因素导致的，不能完全归咎于AI的发展。

太多太多的人根本就没体验过生成式AI工具，我们有理由相信，生成式AI的最终发展，很有可能不会像很多人说的那么具有革命性。生成式AI不太可能成为新一次工业革命的导火索。

古典风资讯网

OpenAi与谷歌相继发布新品，AI战火重新点燃

宁静致远零二