开始前先给大家讲一个段子的一部分,文章最后会有完整版。
如果地球上进化出了不想要的动物怎么办?
答案:扔个小行星过去。
去年要评论最热的东西,人工智能,机器学习绝对算一个。那么他们到底是什么呢?这篇文章我们就来讲讲。
大概 2005 年前后的时候,广告里到处都是说数字技术,数字电视等等。有一个没有计算机从业背景的人问我什么叫数字技术?那时候我才发现还真不知道怎么回答这个问题,就草草的给了一个技术解答,结果对方完全云里雾里。一些年后,我才意识到他问我这个问题,其实并不是想要这种技术细节的解释。他更希望知道的是,数字技术有什么优势。然后又过了一些年,我才弄明白了数字技术的优势,并且给出了一个普通人也能够理解的回答。
从计算机从业人员的视角来看,数字技术其实并不复杂。不就是把信息都用数字(二进制)来表示嘛。那么为什么要这么做呢?稍微想一想也能知道答案,因为计算机只认数字嘛。数字技术和计算机是一个互为因果的东西。我们需要数字技术,本质是需要计算机来处理信息,而又因为计算机只能处理数字,所以我们就把信息表示成了数字。
接下来就是最核心的问题了,这样做有什么优势?让我们把目光放远一点,去看看计算机还没有发明出来的日子。如果你要记录影像,那你得在相机里装上胶卷,拍下来之后,在暗房里把胶片洗到相纸上。(千禧一代可能都不知道什么叫洗照片了吧。)如果你要记录文字,那你得真刀真枪的用笔把文章写到纸上。然后把稿子给到印刷厂,印刷厂再排字印刷。如果要记录声音,你需要把声音录在专门的介质上,远一点的有唱片,近一些的有磁带。这就是数字技术之前信息的存储方式,每种信息必须单独处理。那么数字技术出来之后呢,相片,文字,声音等等的底层表现都数字这同一种东西。结果就是我们可以用同一种存储介质来存储所有的信息,剩下的就是去不断的发明更好更便宜的存储设备。只要发明出一种,那么所有都受益,而不像以前,你发明很厉害的胶卷,那就只对照相有意义。这就是数字技术最大的优势,信息存储的统一化。
然后我们来看下机器学习。同理,给出一堆机器学习的技术解释,其实对非从业者来说,完全没有意义。那么机器学习到底解决了什么问题呢?
在有了数字技术之后,我们已经得到了统一的数字存储格式。然而当我们需要从这些数据中得到些什么的时候,我们就需要写程序了。比如为了给围棋选手写一个对弈的对象,你就需要写一个围棋程序。为了给电子竞技的选手写一个对手,就需要写一个自动进行游戏的程序。如果你得到了一个鸡尾酒会里所有嘈杂的录音,你需要把不同人说的话分离出来,那么你就需要写一个分离声音的程序。如果你想要在图片中识别出人脸,那你得写过人脸识别程序。如果你想让计算机自动写文章,那你就得写个专门的程序来实现(这个非常难)。由于各种问题的规则不一样,所以你就得把这些规则给翻译成对应的专有程序,可以想象,你需要解决的问题越多,程序的数量就会越多。计算机出现以来,相关从业人员在做的很多事情就是怎么解决这个问题。机器学习和人工智能就是其中的一个解决方案。
我们都知道人类可以完成很多本质上看起来完全不同的任务。比如我们能下棋,我们能打游戏,我们能在鸡尾酒会里听出不同的人说话,我们一眼就能从照片中识别出人脸。我们也能看似凭空创造文章,画,音乐等。计算机界也希望计算机能用这种方式来运作。这就有了人工智能(人造的模拟人类的智能)以及其背后的技术机器学习(像人一样学习的机器)。最终理想状态就是只需要一个程序,然后就能够处理很多不同种类的任务。
随着我们对人类自身认知的加深,现在已经有了一套比较完整的理论来解释这个现象。在这个经验的基础上,我们把这套理论移植到了计算机上。结果程序变的和人一样,你只需要给他不同的类型的数据就可以产生出不同的结果。所以机器学习和人工智能的优势就是能大大的减少需要专有程序的数量。和数字技术统一存储格式一样,机器学习就是想把信息处理统一化。
希望你能看到这里。那么我来把我编的段子讲完
版本一:
信息的存储方式实在太多了,怎么办?
答案:数字技术
处理信息需要太多种方式了,怎么办?
答案:人工智能和机器学习
如果人工智能和机器学习得到的结果不满意怎么办?
答案:把训练数据删了从头再来
版本二:
生命的组成方式太多了,怎么办?
答案:用 DNA 来统一表示
每种生物都是独特的,所有都单独处理太多了,怎么办?
答案:进化论
如果地球上进化出了不想要的动物怎么办?
答案:扔个小行星过去
长按关注「七镜花园」