机器学习的神奇意义
上一期小妞带大家了解了大数据的特点,而与大数据经常一起站在镁光灯下的就是人工智能啦。那么它们之间有什么样的关系呢?人工智能和机器学习是一回事儿吗?……来来来,今天给大家“投喂”一些干货,方便大家由点及面地了解FINTECH的基础。
大数据使计算机变得更加智能
随着互联网特别是移动互联网的发展,数据的体量呈几何级增长、来源方式也是多种多样,数据类型不仅仅局限于“数字”,就连金融领域涉及到的数据库也开始有了文本型与图像型来更深入表达客户特征与企业信用级别等等。
因此,仅仅依靠传统的数据分析方法几乎不可能从非结构化、不受横轴纵轴限制的多维数据中找到规律并获得结论。这就需要机器学习对大数据进行挖掘。反过来,大数据也成就了机器学习,使得计算机的智能水平产生了飞跃,并在更多领域超越人类获得更高的智能。
那么问题出来了,“机器学习”看来很重要,它与人工智能有着怎样的紧密联系、跟人类学习有什么差别呢?
“人工智能”与“机器学习”
傻傻分不清?
相信不少人搞不清二者的区别。本质上来说,机器学习可以看成是实现人工智能的一种方法。而人工智能(Artificial Intelligence)在今天有两个定义,第一个是狭义的概念,即20世纪五六十年代特定的研究机器智能的方法或者称为人工智能1.0。第二个是泛指机器智能,也就是任何可以通过图灵测试的机器,都是智能化的。
机器学习就是那个成功将人工智能范畴从第一个狭隘的定义扩大化的功臣。它的意义说得再通俗一点,就是你今天用到的各种智能家电比如小米家居、享受到的智能交互服务环境等等,都是拜他所赐。以至于现在研究人工智能的专家们都更愿意称自己为“机器学习”专家,因为这个领域才足够宽广、足够有现实应用价值:正是有了机器学习,人工智能才不再高高在上地只存在于人形机器人、像人一样思考的领域;任何物件,只要有一个小小的可以大量计算的芯片就能自带一个“大脑”、就能成为一个智能的存在——如同《变形金刚》里一个普普通通的微波炉都能幻化成汽车人那般的神奇。
那么它是如何做到的呢?
要像人一样思考才算人工智能?
在过去的狭义概念中,也就是人工智能1.0时代认为“机器要像人一样思考才能获得智能”,所以必须首先了解人类是如何产生智能的,然后让计算机按照人的思路去做,这就是典型的“鸟飞派”思维,即我们的直觉最容易想到的方法。人类发明史上早期在很多领域都模仿动物的行为:人类很早就梦想像鸟一样飞行,无论是东方还是西方都有类似的记录,将鸟的羽毛做成翅膀绑在人的胳膊上往下跳,当然实验的结果可想而知。
在人工智能领域也是如此,至今人类对自己的大脑运行机制都还是一知半解,更别提教会一台机器来进行人类的思考了。这就是为什么在大数据技术被广泛运用之前,人工智能的发展脚步都不如今天这样迅猛。
所以在今天几乎所有的科学家都不再坚持这个方法。
简单回顾下图灵测试
阿兰图灵(Alan Turing)在一篇题为《计算的机器和智能》的论文中提出了一种验证机器有无智能的方法:让一个人和一台机器坐在幕后,让一个裁判同时与幕后的人和机器交流,如果这个裁判无法判断自己交流的对象是人还是机器,就说明这台机器有了和人同等的智能。这种方法被后人称为图灵测试(Turing Test)。计算机科学家认为,如果计算机实现了以下几个技能之一就被认为具有图灵指的智能:
今天的计算机不仅做到上述几件事还能超过人们的预期,后面我们会了解计算机是如何战胜围棋世界冠军的故事。
“我不知道你们人类怎么思考,
但我就是可以比你们还聪明”
机器学习就是那个除了人类思考之外,将顽石都能变智能的神奇方法。
它把训练集(training data)即样本数据交给计算机,计算机使用学习算法(Learning Algorithm)或者建模方法来归纳总结数据特征。那么,什么又是算法呢?可以看成是解决问题的方式。比如,在计算机科学中的二分查找法(binary search algorithm),就是一种在有序数组中查找某一特定元素的搜索算法。这个方法最大的优势就是可以减少一半的运算量。
不知道大家有没有玩过一个猜数字的游戏,在1-100这个范围中找到某个特定的数字。如果使用二分查找法,通常先猜中间那个数也就是50,再根据提示不断缩小范围,一般6、7次或者更少次数就能找到正确的数字。
机器学习就是采用数据驱动的方式进行学习。计算机总结规律的过程就是建模的过程,之后根据总结出的规律对训练集(training sample)贴标签进行分类,从而得到最优模型。比如,我们从小认识汽车,就是通过辨认汽车的特征进行学习、归纳总结出汽车的特点,下次再遇到汽车时,即使与之前见过的不同也能做出判断。对于计算机,我们只要“喂”给它足够多的汽车图片样本,它自己就能从中总结出规律。随着互联网的出现,可供计算机使用的数据量成倍增长,数据驱动方法的优势越来越明显。
数据驱动是大数据的基础,也是智能革命的核心,更为重要的是它带来一种全新的思维方式。在吴军博士写的《智能时代》一书中,举了Google的AlphaGo战胜天才围棋选人李世石的故事。AlphaGo通过总结几十万盘人类高手的对弈数据,得到了一个统计模型,从而获得在不同局势下该如何行棋,这就使AlphaGo找到了打败人类顶尖高手的钥匙。
是的,“通过海量学习,我们可以比你们更聪明!愚蠢的人类,你们害怕了吧?哈哈……”
配图来源网络