《终极算法:机器学习和人工智能如何重塑世界》读书笔记
by 冬瓜 on Mar 05 , 2018 , under 知识管理 , 419 views , Leave a Comment
这是一本非常难读的书,书中太多专业性太强的术语看的人眼花缭乱。
五大学派
符号学派:逆向演绎,从哲学、心理学、逻辑学寻求洞见——>逆向演绎。
连接学派:对大脑进行逆向分析,来源于神经科学和物理学——>反向传播。
进化学派:在计算机上进行模拟,利用遗传学和进化生物学——>遗传编程。
贝叶斯学派:概率推理,理论基础是统计学——>贝叶斯推理。
类推学派:通过相似性判断来外推学习,接受心理学和数学最优化的影响 ——>支持向量机。
机器学习的革命
传统的算法是你将数据输入到计算机,计算机本身是利用算法来进行计算和处理,最终输出你需要的结果;而机器学习算法刚好是颠倒的,即你输入到计算机中的是输入数据和输出数据,而计算机最终输出给你的是有价值的算法。这就是两者最大的区别。
这个算法需要不断的学习和训练,因此数据量和样本数越多,算法就越准确。注意为什么最终会得出这个算法,这个算法存在的逻辑是如何的?计算机也搞不清楚,本身也不需要搞清楚,计算机只知道这个最终输出给你的算法是最匹配已有历史输入和输出数据的。
在机器学习中,知识往往是以统计模型的形式存在,而技能则是以程序的形式存在。这句话有点难以理解,我们可以把这个简化描述下,即:
if(知识点X1,知识点X2,…,知识点XN) Then or You Should do(知识点XY)
人的思考和经验积累也一样,即不是单纯的积累知识点,而是应该积累上面这种经验模式或者叫算法模式。这和我上篇文章谈的知识和经验中的一些观点又是相同的。
工业革命是手工业自动化,而机器学习使自动化本身自动化。在公司发展壮大后,往往会经历三个阶段:
1.所有事情都人工完成。
2.所有事情或大部分事情通过计算机自动完成。(但是思考并形成可重复自动化运行的算法是人做的)
3.部分思考被机器替代。(即机器本身通过学习自己产生算法,而替代人的思考)
对于机器学习算法本身,其方法本身和人类的思考方法也是类似的,即产生假设,验证,放弃或完善,反复的修正和迭代。那么人形成算法的过程和机器最大的区别在哪里的?
1.人往往是期望通过最少的现场归纳出普适的定律或法则,形成解释世界的精确模型公式。
2.机器则是通过大量数据,越多越好,通过自我训练和学习得出最终算法,这种算法本身逻辑不需解释。
但是在人的算法过程中,并不是所有的现象都是线性的,都可以用模型精确描述,包括后面人类遇到的NP难题等,往往并没有一个精确模型或最优解。而机器学习则打开了这个全新的非线性模型世界。
金句摘录
人们往往认为计算机只和数字有关,其实并非如此,它完全关乎逻辑。数字和算术都是由逻辑构成的,而计算机的所有其他部分也是如此。
人们常说,你没法真正了解某样东西,直到你能用一种算法来将其表达出来(理查德·费曼曾说,“如果我无法创造某样东西,那么也就无法理解它”)。
每个算法都会有输入和输出:数据输入计算机,算法会利用数据完成接下来的事,然后结果就出来了。机器学习则颠倒了这个顺序:输入数据和想要的结果,输出的则是算法,即把数据转换成结果的算法。学习算法能够制作其他算法。通过机器学习,计算机就会自己编写程序,就用不到我们了。
互联网协议就是一种世界语言,会给每台计算机能与其他所有计算机直接对话的错觉,世界语言还允许电子邮件和网页忽视那些它们无法起到影响作用的基础设施建设的细节。
电力就是能源的世界语言。终极算法是机器学习的统一物:它让任意应用利用任意学习算法,方法是将学习算法概括成通用形式——所有应用都需要知道该形式。
机器学习的五大学派以及它们的主算法:符号学派和逆向演绎,联结学派和逆向传播,进化学派和遗传算法,贝叶斯学派和概率推理,类推学派和支持向量机。