当AI学会了制造AI……

未来图灵 2017-11-07 22:06:25

“AI在让自己变得更聪明的过程中,变得更聪明。”这句话很绕,但看过谷歌和Facebook等公司推出的AutoML等自动化机器学习模型设计的算法后,就会突然明白:

“人工智能机器能够创造出人工智能机器”对于高级计算机程序员来说“是一场噩梦”,也只涉及到了一个方面而已。

AutoML等算法以及它们所代表“实现自动化”的研究分支,再一次证明,AI的智能化水平是呈指数式增长(敲黑板,划重点)的。未来的某一天,人们将可能亲眼看见AI代替人类专家创造出它的同类。(“指数式增长”这个词,终于得到了重量级关注= =)

谷歌微软fb向外界发出的信号

早在今年5月的I/O大会上,谷歌首席执行官 Sundar Pichai就面向 app程序员和硬件制造商,新发布了这款与Facebook的 AutoML同名的算法,引起国内外媒体对AI智能化水平的关注。

而最近,谷歌的首席工程师Jeff Dean在硅谷和中国的演讲中多次提及了谷歌的AutoML项目,以再次代表谷歌向外界传递“人工智能已经达到一定水平,人们应该引起重视”这一信号。

此外,微软也公布了一款能够帮助写代码的程序员搭建深度神经网络的算法。微软的副总裁Joseph Sirosh对此表示:“我们正在消灭大量体力活。”

AutoML(其中ML是Machine Learning)及其同类算法的突出表现在于,它们能够“学会学习”(learning to learn)或者“元学习”(meta-learning,指个体获得学习机制的学习,涉及的是关于个体如何获得其赖以进行学习的机能的问题)。

尽管AutoML及其同类还只是一款机器学习算法,一家独立的机器学习研究中心Element AI的首席执行官Jean-François Gagné甚至把它们称为“一款新的电脑程序”,但据悉,它们已经能够创作一些算法,例如比人类专家自己写的算法还要更准确地识别图片中物体的算法,未来将应用到语音识别或机械翻译等方面。

相信随着智能化水平的提高,AutoML或将成为真正意义上的AI产品,代替人类专家开发出它的同类。

经验调优是一种“黑暗艺术”

AutoML主要的功能只有两个,一是模型/算法选择,二是模型超参数优化。就字面意义而言,前者容易理解,就是帮助解决在自动化设计深度学习软件中最难的一个部分——为神经网络选择正确的架构。但是后者的专业解释是这样的:

超参数优化,算法包括:Hyperopt(TPE 算法);SMAC(基于随机森林);Spearmint。输入不同的超参数,以损失函数为准确率,调优器会在随机选择一些值的基础上,利用贪心算法去寻优。

【呆】Penny听Sheldon讲解量子物理学理论时的表情......好吧,上面的解释不一定大家都能get到~

有分析文章指出,尽管图像识别、语音识别、机器翻译等项目之间的结构差别很小,但是一个效果好的模型却需要大量的经验来调优。具体过程包括以下几个步骤:数据预处理、特性选择、模型算法选择、调参、上线后模型的再优化。

在构建神经网络时,研究员需要对同一网络系统中的众多机器实施几十或几百次实验,从而验证一个算法自主学习和完成任务的能力水平到底去到哪里。然后,他们会一次又一次地修改算法中的某些部分,直至他们觉得这个算法能够很好地运行为止。

“人工设计机器学习模型的过程实际上绝非坦途,因为所有可能组合模型背后的搜索空间非常庞大——一个典型的十层神经网络可能有~10^10种可能的神经网络组合。但问题也接踵而至,为了应对这样庞大的数量级,神经网络的设计不仅耗时,而且需要机器学习专家们累积大量的经验。”

《纽约时报》还在报道中指出,连研究员自己都不知道怎么解释这一遍又一遍的调整工作。他们都不知道最终版本,“好”到底好在哪里——有些人把这个称作“黑暗艺术”。

“这件事是有市场的”

作为自动化的研究方向之一,AutoML及其同类算法,能够给众多公司和软件开发者带来最新、最厉害的AI技术。此前,谷歌、亚马逊和微软等公司也通过对外销售云计算服务,来帮助其他公司和个人开发人工智能系统。

据中国的一家致力于软件和信息开发的公司东方马龙的联合创始人和首席技术官Matt Scott估算,现在有权开发人工智能的公司不过几千家,但是拥有重要数据的公司比这多得多。

“这件事是有市场的,”Mr.Dean表示,“但这些工具还没能完全满足所有需求。”

当然,最重要的原因还是:行业不愿意等。AutoML及其同类算法,将帮助解决行业缺少人工智能领域的专家这一问题。

据估算,全球只有1万人——这些人具备相当高的教育水平、天赋,以及相当丰富的经验——能够开发那些非常复杂,有时候可以说是非常神秘的数学算法,来满足人工智能发展的需求。

每年,谷歌、Facebook和微软这些世界顶尖的科技公司,都会在AI领域专家身上砸数百万美金,以有效地垄断人才市场。但由于掌握应用于AI领域的技能需要花费好几年的时间,AI领域专家的稀缺这一问题并不会在短时间内得到解决。

“抢购”了大量世界顶尖AI研究者后,Auto及其同类算法的出现,相当于帮助各大科技公司找到了又一个“经济引擎”。

本文为未来图灵(futureturing)独家文章,转载请申请授权并注明来源。

0 阅读:1