熊彼特说过,创新是要“建立一种新的生产函数”,也就是形成一种从来没有过的生产要素和生产条件的“新组合”。从这个角度看,数据这一新的生产要素与人工智能技术的生产条件相结合,这何尝不是一次彻彻底底的创新,它带来的智能化变革将是何等澎湃。
2023年,AI大模型的崛起,我们似乎也从中看到了AI时代加速狂奔的热血图景。按照中国科技部新一代人工智能发展研究中心,此前发布的《中国人工智能大模型地图研究报告》显示,中国10亿参数规模以上的大模型已发布79个,百模大战成为定局。
大模型的火热,再度点燃了AI时代的火焰,但同时也为我们带来了新的启示:数据是人工智能的“燃料”,AI时代这把火焰燃烧的强度和热度,完全取决于数据的价值是否能得以释放。
在AI时代,数据存储与人工智能之间的逻辑关系,也必然是相互促进,螺旋式上升的模式。这也意味着AI时代的发展,同样会带动数据存储行业的发展。
01
数据之于AI的价值提升
众所周知,数据之于人工智能的意义,就像是电动汽车需要电池一样,如果没有足够数量级的存储数据,人工智能所能实现的价值也会极为有限。
在AI行业中,也一直有着"垃圾进、垃圾出 (garbage in, garbage out)"的共识,也就是说如果没有高质量的数据输入,则无论多么先进的算法、多么庞大的算力都无法带来高质量的成果。所以,决定AI智能高度的主要原因取决于数据的质量。
当然,除了数据的质量之外,数据的量级也决定了AI大模型所能成就的高度。
因为,基于小规模数据建立的模型,其表达能力受限于数据规模,只能进行粗粒度的模拟与预测,在精度要求比较高的情况就不再适用。如果想要进一步提升模型精度就需要利用海量数据生成相关模型。
这就说明,数据的规模同样决定AI智能的价值。所以,无论数据的质量,还是数据的数量级,都说明了数据对于人工智能的作用,随着AI应用的深入愈发的凸显。
这个道理很容易理解,当AI系统拥有更多更好质量的数据时,它们可以更好地预测未来趋势,并产生更多价值。
例如,特斯拉通过海量数据,来训练其强大的人工智能驾驶模型,为全球用户带来了非凡的体验;而互联网平台,则经过大量用户数据,用以人工智能进行分析,可以针对用户画像来定制数字广告,仅此一项就预计会在2023年,带来全球数字广告高达6798亿美元的收入规模。
这些案例,无一不在证明,数据对于人工智能的价值提升,乃至商业模式创新所具有的重要意义。
02
AI时代驱动数据存储高速发展
这个逻辑,反过来理解,也是成立的:人工智能的大行其道,又产生了更为巨量的数据,这就对数据的存储和处理都提出了更多的挑战
随着全球数字化浪潮的奔涌,数据中心正在以几何级速度建设,Schroders 2023年的一份报告显示:数据中心的耗电量将从2022年的17吉瓦,快速提升到2030年的35吉瓦,这意味着未来8年间数据中心的总量有望翻倍。
与之相应的,则是数据存储需求的暴增,《财富商业洞察》预计,全球数据存储市场,预计将从2023年的2473.2亿美元增长到2030年的7779.8亿美元,市场规模几乎将要翻上3倍。
这两项数据的对比,说明数据存储的増量率,要远高于数据中心的增长率,我们从中也可以读出两个细节:
第一,正因为AI时代的到来,对新建数据中心提出了新的要求:数据存储能力成为了建设的重点;第二,数据存储扩容需求,已成为数据中心建设的主要驱动力。
由此,我们也不难得出一个新的结论:AI时代的发展,势必会推动数据存储领域的高速发展。数据存储领域的核心厂商,将在市场上拥有更可观的未来,尤其是以希捷为代表的核心技术的拥有者,将在市场需求激增中,获取最大份额的业务增长。
03
HDD在AI浪潮中的独特地位
实际上,过去几年业内普遍存在一种错误认知:认为HDD会被SSD全面取代,但实际上,数据中心云服务商,在云端的存储需要大量高密度、大容量的HDD来实现,这种市场需求的出现,让数据中心HDD产品的增速并不亚于SSD。
而实际上,无论是HDD代表的大数据需求,还是SSD代表的快数据需求,都在不断扩大需求规模。尤其AI时代的到来,对HDD的需求更是与日俱增。
希捷科技赞助、国际数据公司(IDC)发布的《数字化世界—从边缘到核心》白皮书预测,云数据中心正成为新的企业数据存储库。IDC 预测到2025年,49%的全球已存储数据将在公有云环境中。因为人工智能对话主要集中在处理器和云存储上,而云存储则更为依赖于HDD。未来人工智能创建的数据将需要更多的HDD来存储。
我们也无法想象,硬盘行业在过去45年里的发展速度如此之快,上个世纪80年代,一块5.25英寸的硬盘,仅能存储500万字节的数据,而2023年最新的技术,希捷在7月已经向部分客户提供了新产品,每块的存储量可高达30TB。
正是数据存储技术的飞跃,为行业创造了更多想象空间。但人工智能的浪潮对数据存储的需求正在以数量级的速度增长,也许今天唾手可得的硬盘,会是未来几个月内的“稀缺”产品。
《福布斯》在最近的一篇文章中预测:2020年至2028年,硬盘产品的出货量将增长900%。这意味着,如果云服务商无法采购足量的数据存储空间,甚至将有可能无法满足人工智能增长的需要。
从机械硬盘目前的市场格局来看,这是一个市场集中度很高的市场,希捷、西部数据和东芝三分天下,而希捷的占有率独占鳌头。它们的产品创新能力,一定程度上决定了数据存储整个领域的发展节奏,进一步也将左右AI时代升级演进的步调。
有人工智能的地方,就有数据。有数据的地方,就有数据存储。在AI时代的呼之欲来的当下,我们也需要给予机械硬盘为代表的数据存储正确的价值定位。