一位人工智能行业的专家提前看了谢耘博士的这篇文案,他是这般反馈的:“ 我觉得这篇文案写的尤其好。此刻非常多人在谈论元宇宙,区块链,还有憧憬自动化的设备学习( AutoML)。我觉得距离真正的AutoML还很遥远。人工智能现周期本质上还是比算力和比调参。在很长的时间内,模型训练的过程会很繁琐。
专业行业的知识更加是不可或缺。
您这篇文案相信能够纠正非常多人关于人工智能的想法。
非常感谢有机会拜读学习。”
现代人工智能的办法过于零散,无一个统一的框架,彼此之间的关系亦模糊不清。《人工智能:一种现代办法》一书(Stuart Russell & Peter Norvig著,《Artificial Intelligence---A Modern Approach》, Prentice-Hall出版,2003第二版),试图用智能体Agent这一概念来统一描述人工智能的办法,但似乎并无更好地揭示人工智能办法的本质。本文试图从计算机处理问题的过程本质出发,来创立一个框架,统一描述计算机处理问题的办法,从而揭示人工智能类办法的本质特征。
本文的基本思路是创立在计算机处理问题的基本模式之上的。计算机处理问题的基本模式能够概括如下:
实质问题----问题的规律计算化---处理问题的算法/知识---计算机程序---问题的处理结果。
围绕这个主线,能够逐步准确描述分解各个环节,从而将计算机应用问题做一个完整的框架性描述,看清每一种办法自己的定位,帮忙理清各样办法彼此之间的关系等等。 多余的“人工智能”概念:计算机应用本便是智能过程人类进入21世纪第二个十年之后,信息技术有了令人眼花缭乱的惊人发展。在许多“智能”方面已然超越了人类。然则,信息技术的基本一如其诞生之初,并无改变。信息技术的核心计算机依然是,且仅是一个可编程的规律计算工具。只是今天它的计算能力与当初已然有了天壤之别,计算机在21世纪第二个十年拥有了“暴力计算”能力(详见:谢耘著,《智能化将来——“暴力计算”开创的奇迹》第二章,机械工业出版社2018)。
计算机的基本——可编程规律计算能力算不算“智能”?对此非常多人的看法是不是定的。咱们把识别照片做为理所当然的“智能”,况且为计算机能够识别繁杂的照片而欢欣鼓舞,当作人工智能的一个重要的进步。而识别照片,是人类不需要特殊训练就拥有的能力,然则规律计算却是人类需要必定的训练才可具备的技能。倘若咱们认为“智能”是人类大脑独有的功能属性的话,那样规律计算不被认为是“智能”,岂不是对人类大脑所做的奋斗的一种莫大的嘲讽?
因此,计算机最基本的能力——规律计算能力便是“智能”,或说是一种智能活动,只是由于计算机一起始就以此为其存在的基本,咱们无视了其智能的属性。从这个方向来看,计算机的应用其实都是智能类应用,只是“繁杂”或“难易”程度有所区别罢了。 正是因为人类无理解自己创造出来的计算机与生俱来的可编程规律计算能力的智能本质,因此在1956年“人工智能”这个词被创造了出来,尽管当初、乃至迄今人们亦依然无能力给它一个准确的科学范畴内的定义。提出“人工智能”这个概念的潜台词,便是用计算机实现的其它哪些基于可编程规律计算的应用都不属于“智能”范畴。当看明白计算机实现的可编程规律计算处理,在本质上便是“智能”活动,属于人类的“外认识”活动后(详见:谢耘,“信息技术的智能本质与人类的‘外认识’”,微X“慧影Cydow”公众号,2019年5月9日),咱们不难发掘,造出“人工智能”这个词,颇有画蛇添足的味道。尤其在“人工智能”概念存在了半个多世纪后,咱们依然找不到它能够安身的科学基本原理、乃至亦没法给“智能”下一个科学的定义的状况下,在科学与技术的范畴内,这个词就更显出有些多余。(详见:谢耘,“人工智能‘修炼成精’还是遥遥无期的梦想”,微X“慧影Cydow”公众号,2019年5月9日) 计算机处理问题的基本模式:用算法处理规律计算问题虽然计算机的应用五花八门彼此迥异,然则计算机处理的所有问题的途径,都是通过规律计算来完成的。因此,所有的计算机应用都能够概括为下面几张图所示的一个基本模式。
图一 实质问题的规律抽象
首要,咱们要对需要处理的区别行业的实质现实问题做分析,将其抽象转化为一个规律计算类问题(见图一),就可能用规律计算来处理的问题。这个过程一般是一个所说的“数字化”或“建模”过程。 从这个方向讲,计算机应用的历程便是从容易抽象为规律计算类问题的实质问题起始,逐步拓展到去处理哪些不太容易被抽象为规律计算类问题的实质问题的过程(详见《智能化将来—“暴力计算”开创的奇迹》第三章)。
计算机最起始的应用行业是工程/科学计算,这类问题基本不需要做抽象,本身便是规律计算类问题。而今天众多的所说“人工智能”类问题则在表面上看起来与规律计算类问题很不同样,需要各样数字化与抽象建模的处理才可变成一个规律计算类问题。 将一个实质问题抽象映射为规律计算类问题之后,就起始进入了利用计算机来处理问题的周期。这儿分成两个基本的、并行关联的环节。
一个是这对这个规律计算类问题,设计出一个有效的、计算机能够实现的处理它的规律计算处理流程(亦便是所说的“算法”,其中包括了关联的知识),以此为基本形成处理问题的软件程序。因此一个软件程序便是某个“算法”的详细表现形式;另一便是要准备好处理问题所需要的信息/数据,形成程序所需要的输入。 这里基本上,计算机就能够利用自己的规律计算能力,在软件程序,亦便是人类的“外认识”的掌控下完成对输入数据的处理,给出问题的答案(见图二)。
图二 用算法处理规律计算问题显而易见,针对区别的问题,软件程序包括了区别的知识,实现的是区别的算法流程。虽然区别的算法与知识在繁杂程度上有很大的差异,然则这些软件程序却都是人类的“外认识”,同属于智能类活动。就像博士生动脑子是人类的智能活动,小学生动脑子一样亦属于人类的智能活动。
倘若思虑到实质出现的状况,图二中处理问题所运用的算法,有时不是一个单向的过程,而是会有多次的反复“迭代”修改完善的繁杂环节在其中,而这个过程一般要借助系统的输出结果中的信息来进行,因此实质上这种状况是一个在实践中持续完善的“反馈”过程。倘若把这个反馈优化完善的过程显性地表现出来,图二就演变变成为了图三。
图三 用算法处理规律计算问题,同期连续改进算法咱们不难看出,图二的模式与图三模式是等价的,图三只是把处理问题的算法中按照结果做反馈改进的过程显性地表现了出来罢了。当然,图三中的反馈过程亦可能是由于人来完成的,这便是在咱们讨论之外的状况了。
针对从图一到图二所示的计算机处理问题的通常模式,咱们能够做如下的一个概括:任何一个问题,仅有把它变成规律计算类问题,计算机才有可能处理它;反过来,计算机处理任何问题,都是经过规律计算过程来完成的。 因此,当咱们好奇计算机是不是能够做某件事情时,咱们首要要做的便是去瞧瞧咱们是不是有可能把这件事变成一个规律计算类问题。
当然,并不是把一个实质问题转化为规律计算类问题,就必定能够找到一个有效的算法去处理它。这个寻找有效处理问题“算法”的过程,是无一个绝对可行的办法论能够依靠的。它迄今依然是一个严重依赖人的大脑的创造性工作,况且在能够预见的将来,依然会如此。 因此计算机自动编程,亦便是计算机自动寻找并实现处理问题的有效算法,还是一个遥远的梦想。
然则这并不寓意着计算机在寻找和设计处理问题的算法的工作中就无所做为。“设备学习”便是人类借助计算机来寻找处理问题所需算法的技术。 “设备学习”(Machine Learning)办法的本质:用“学习算法”去帮忙最后确定完善处理问题的算法记得有一个国际人工智能界的名人曾经说过一句话:“人工智能便是机器学习,设备学习便是人工智能。”因此,倘若咱们能够搞清楚“设备学习”的本质,亦就理解了“人工智能”到底是什么了。那样咱们就来看一下“设备学习”这个听上去高深莫测的技术,在本质上是一个什么样的过程。
既然“设备学习”亦是由于计算机完成的工作,因此它必然亦无跳出图一到图三所概括的计算机应用的基本模式。由于“设备学习”是一个寻找算法的过程,与图一关系不大,因此咱们从图二来起始分析。 针对一个规律计算类问题,倘若咱们能够找到一个有效的算法,显然就不需要什么“设备学习”来帮忙,直接根据算法编个程序问题就处理了;反过来,倘若针对一个规律计算类问题,咱们完全摸不到头脑,不晓得去任何方向来寻找处理它的算法,那样“设备学习”亦无任何用途。
“设备学习”有用武之地的场合,是针对哪些规律计算类问题,咱们不晓得哪个完整的算法能够处理它,咱们却晓得有某个“类型”的算法(例如求解某个函数)能够处理或可能处理它,然则咱们需想要办法确定算法的中的有些成份(例如函数中的参数)才可完全把算法知道下来,而后用它去尝试处理这些问题。 例如,咱们想确定一个火炮的详细位置,咱们晓得它发出的炮弹的弹道在不思虑空气阻力等原因下能够用一个二次方程来描述(抛物线),倘若晓得了这个二次方程,咱们就能用二次方程求解的算法来确定火炮的位置。然则咱们事先是不晓得这个火炮发出的炮弹轨迹的二次方程里的三个参数的,这三个参数便是咱们处理问题需要的算法(二次方程求解算法)中的“成份”。倘若咱们有办法确定这三个参数,那样处理问题的算法就确定了。
因此,在这个例子中,确定火炮位置的问题,是一个二次方程求解类的问题,能够用二次方程求解算法来处理,然则咱们需要晓得炮弹弹道二次方程的三个系数,才可最后确定算法。确定这三个参数,便是设备学习要做的事情。 所说“设备学习”,便是利用计算机帮忙咱们确定处理问题的(可能的)算法中的细节,一般便是算法中所需要的某些“参数”。
因此,“设备学习”在处理问题的过程中,是在辅助人类,而不是独立自主地去处理哪些咱们人类都完全不晓得该从何入手的问题。 那样“设备学习”是怎样确定咱们需要的算法中的“细节”或叫作“参数”的呢?
咱们需要一个所说的“学习”算法,而后用它从所说的“学习样本数据”,即哪些能够从中获取咱们需要的“细节”或叫作“参数”的数据/信息,估算出咱们需要的“细节”或“参数”,而后咱们就能够确定处理本来问题的算法了,问题便迎刃而解。 将以上过程用图来暗示,就得到下面的图四。
图四 “设备学习”办法的基本模式
从图四中咱们能够看出,用“设备学习”的办法来处理问题的时候,相比于图二,看上去它多了一个“设备学习(训练)”的过程,即获取处理问题的算法所需要的参数的过程。 这个设备学习的过程,本质上亦是图二所示的计算机处理问题的过程,即亦是用规律计算算法(所说的学习算法)来达到目的(估计处理问题的算法所需要的参数)的一个过程。
而因为只要不引起算法不收敛等问题,多种“算法”能够组合嵌套组合成一个更繁杂的算法,因此图四中上面的学习算法实质上是能够合并到图中下面处理问题的算法其中的,它所需要的学习样本数据亦能够当作“处理问题需要的信息/数据”的一部分,这般合并之后,图四则被抽象简化变成为了图二,或说图四其实是图二的一种详细状况。 因此,用“设备学习”的办法去处理问题,在本质上依然归属于图二所示的计算机处理问题的基本模式,而不是独立于其外的全新做法。因此呢,它依然要依靠人来设计“算法”去处理问题,这个过程依然是“外认识”发挥功效的过程。在这个过程中,人或说人的“内认识”针对需要处理问题的深刻理解,依然是一切的源头起点。
咱们以前面讲过的确定火炮位置的问题为例,来看一下一个设备学习的详细过程。
图五 火炮定位的“设备学习” 在战斗中,咱们期盼经过A火炮发射的炮弹的轨迹,来确定其位置将其消灭掉。在不思虑空气阻力、风向等原因的状况下,咱们晓得它发射的炮弹的轨迹是由于一个二次方程来确定的曲线。然则咱们无办法事先就晓得这个方程中的三个参数,因此咱们经过“火炮侦校定位雷达”,来获取它发射的炮弹的轨迹中的一部分数据,这便是所说的“学习样本数据”。利用这部分数据,咱们就能够利用计算机估算出来描述炮弹轨迹的二次方程中的三个系数。这般就完成为了图四中“‘设备学习’过程”。而后咱们经过利用计算机求解这个方程。就能够确定A火炮的位置,这便是图四中的“处理问题过程”。B火炮便能够依据这个位置信息摧毁A火炮。
虽然实质状况要更繁杂有些,思虑大气阻力等原因后炮弹轨迹要用更高阶方程来描述,况且是在三维空间,因此呢会有更加多的参数需要确定,然则以上的基本原则是同样的。 这个例子虽然看上去很简单,有中学的知识就完全能够理解,然则它确实便是设备学习办法中的一种。这种设备学习的办法便是所说的“回归分析”办法中的多项式回归分析(赵卫红、董亮编著,《设备学习》,第18页,人民邮电出版社,2018年8月第1版)。而这些年流行的“深度学习”,则是采用了非常高阶而繁杂的函数。函数繁杂到了很难用一个数学表达式来描述,而是采用了一种网络化的描述方式。在用于处理问题的这种繁杂高阶函数中,有成百上千万,乃至上亿个参数需要用设备学习的算法来确定。所说“深度学习”中的“深度”,指的便是这些参数的数量的巨大,并非是咱们一般道理上学习的“深度”。
倘若图四中上面所示的设备学习过程与图中下面的处理问题过程彼此独立,咱们叫作这种状况的设备学习为“离线”设备学习。这儿的“线”指的便是图中下面那个处理问题的过程。 倘若设备学习需要的学习样本数据来自于处理问题的过程的输出结果,这般的设备学习咱们叫作之为“在线”设备学习,这个过程便是图三所示的反馈优化完善的过程。咱们把设备学习过程拆分出来,便得到了图六。
图六 “设备学习”办法的基本模式---在线设备学习
咱们不难看出,图六亦能够看作是图四的一个特殊状况,即“学习样本数据”来自“处理问题过程”的输出。不论对图六作何种诠释,它亦都能够归入图二所示的计算机处理问题的基本模式。 经过上面的分析咱们能够看出,倘若把“设备学习”办法与“常规”的办法相比较,它们的差别就在于在常规办法中,处理问题的算法是事先就确定的,而在“设备学习”办法中,处理问题的算法有未知的成份,需要另一用某种“设备学习”算法来估算出这些未知的成份(一般表现为“参数”),而后才可形成完整的处理问题的算法去处理问题。然则这个差异却并不可否定它们之间本质的共性,即归根结底,设备学习办法亦罢,常规办法亦罢,不外都是利用计算机经过计算机能够实现的规律计算的算法,去处理规律计算问题的过程。都离不开人针对问题的理解以及这里基本上设计出来的算法去处理问题。因此,图一与图二是对计算机处理问题模式的基本概括,而后面几张图是这种概括在详细状况下的展开表达。设备学习办法的“工匠”特征设备学习办法相当庞杂,并非是像数学或理学学那样,创立在几个基本公理/定律之上。区别办法有区别的源自,有区别的长短。针对一个实质的问题,把它变成哪种类型的规律计算问题,用哪种设备学习的办法能够有效的处理,是无必定之规的,这与传统的经典科学技术行业有很大的区别。
这个过程,既依赖对区别设备学习办法的理解和已有的关联经验,还需要海量的反复尝试。因此这是一种“现代工匠”类型的工作。 咱们以设备学习中的著名的深度学习为例来看一下其工匠性质。在《深度学习》(【美】伊恩·古德费洛等著,MIT Press出版,2016年)这本被认为是“深度学习”行业奠基性的经典教材中,作者为了阐述深度学习的这种实验性工匠特征,专门在第二部分设置第11章来讨论这个问题,它的题目取为“实践办法论”。在这一章的开头,作者写了这般一段话:“要成功地运用深度学习技术,仅仅晓得存在那些算法和解释它们为么有效的原理是不足的。一个优秀的设备学习实践者还需要晓得怎样针对详细应用挑选一个合适的算法以及怎样监控,并按照实验反馈改进设备学习系统。在设备学习系统的平常研发中,实践者需要决定是不是收集更加多的数据、增多或减少模型容量、添加或删除正则化项、改进模型的优化、改进模型的近似推断或调节模型的软件实现。尝试这些操作都需要海量时间,因此呢确定正确的做法而不茫然猜测尤为重要。”这段话比较完整地揭示了深度学习这个详细技术的“现代工匠”特征。
纽约大学教授Gary Marcus在2018年1月2日发布的导致很大争议的文案“Deep Learning: A Critical Appraisal”(arXiv.org,2018年1月2日)中提出了深度学习的十个局限,其中第十个“Deep learning thus far is difficult to engineerwith”指的亦是这个问题——“深度学习”还只是一个就事论事的办法,无办法做为一个标准普适的有效的工程办法被用来去有效地处理区别的问题。换句话来讲,以深度学习为表率的设备学习法,是一种现代的工匠技艺,而不是其它行业中现代工程师运用的、有坚实现代科技基本的工程化普适办法。(谢耘,“‘深度学习’与工匠技艺”,微X公众号“慧影Cydow”,2018年3月22日)
其实这个问题并非是设备学习所独有,而是做为人类“外认识”的计算机应用的基本特征。其根源便在于人类迄今为止,无构建出关于人类认识活动的完整的科学理论,仅有有些实验性质的描述与推测,因此当咱们把人类的认识外化为计算机应用的时候,它在总体上就只能是一种基于工匠技艺的手艺活。早就有人指出软件编程是一种艺术创造过程,原由亦在于此。由此亦带来了一个问题:算法自己的繁杂程度,并不可表率其技术水平的高低,由于艺术性的创造,是能够为所欲为的。
在人类突破认识活动(或叫作智能)的科学原理之前,计算机应用、即人类的“外认识”的创造活动,在总体上只能是一种八仙过海式的现代工匠技艺。 终极追问 在业界持续有信息声叫作某设备学习已然实现了“问题”无关性,即算法不需要借助人类对问题的理解即能够自己学习处理问题。这显然是有意夸大其词,或算法的设计者自己无视了他在设计算法时带入的对问题的理解及关联的知识。经过前面的分析,咱们能够得到设备学习与人的学习之间的差异。
表一 设备学习与人的学习的对比
在人类突破认识活动(或叫作智能)的科学原理之前,咱们不可能设计出一个与问题无关的万能算法,让设备自己去独立从零起始学习而处理区别的问题。计算机修炼成精还是遥远的梦想。(谢耘,“人工智能‘修炼成精’还是遥遥无期的梦想”,微X公众号“慧影Cydow”,2019年5月9日) 然则这并不寓意着在处理详细问题上,设备学习不会比人强。其实,自计算机诞生伊始,它在规律计算方面的能力就远非人类可比。借助计算机持续加强的精确且永不疲倦的“暴力计算”能力,设备学习办法在处理各样详细的问题方面,自然会持续超越人类。而这正是人类创造工具的重要的目的:拓展人类的能力边界。
人与工具之间的这种辩证的互补关系,常常被形而上学地解释作为了机械的对立互斥替代关系,以至于从工业革命起始后,就持续显现各样版本的设备将取代人的耸人听闻的“预测”。
计算机在处理各样详细问题方面持续超越人,这基本就不是什么预料之外的“奇迹”。今天的设备学习、人工智能及大数据技术核心采用的都是数学统计办法。而早在1964年,英国出版的近代数学通俗读物《统计世界》一书,作者就数学统计办法的应用前景在最后的“回顾和展望”中写道:“在今天的世界上,统计办法的新应用正在持续地被发掘,应用电子计算机进行计算,使专家能够处理过去认为不可能处理的统计问题。统计办法的应用将继续扩大,统计学将在将来的空间时代发挥重要功效。”(【英】D.A. 约翰逊、W.H.格伦著,《统计世界》,第80-81页,科学出版社,1981年)
图七 1964年的“神预测”书中的这段话算是对今天以数学统计办法为核心的大数据、人工智能技术发展的“神预测”吗?其实这只是把握了科学技术本质的专家对将来的一种理性的推断。
来自网络的图八,形象地表达了数学统计办法、设备学习及人工智能之间的关系,并巧妙地暗示了产生人工智能“奇迹”效应的社会心理缘由。
图八 统计办法、机器学习与人工智能针对今天咱们剧烈依赖数学统计及工匠式的办法来处理问题,非常多习惯于经典科学办法的人内心会感到不适。2018年我在山东大学给学生做讲座时讲了设备学习与人工智能的本质。当时一个朋友在提问时说:“我不爱好此刻的哪些人工智能的办法,它们都是统计实验性质的,不像经典科学办法那样清晰严谨精美。”我对他说:“技术是用来处理问题的手段,而不是拿来欣赏的艺术品。只要能处理问题便是有效的办法,就应该去认真学习。”精彩文案 谢耘:信息技术的智能本质与人类的外认识 谢耘:人工智能“修炼成精”还是遥遥无期的梦想 谢耘:洞穿AI迷雾,为么说人工智能复兴是暴力计算“借尸还魂”?
谢耘:“深度学习”与工匠技艺
谢耘:慧影,是一个系统级的整体性的原始创新
【慧影妙招】用慧影建一张课程表吧,学习和生活都能在一块管了
【慧影妙招】怎么记农历生日,并且能够年年提醒? 联系咱们慧影官网:www.cydow.comQQ群:580609789客服tel:13720028991反馈邮箱:cydowsupport@cydow.com不要忘记和大众一块“在看”哦~☟☟☟
|