“ 机器学习和自然语言处理是人工智能领域的分支。”
我们经常能听到人工智能,机器学习和自然语言处理,甚至很多人把机器学习当作人工智能。
但它们三者之间到底具有什么样的关系?
机器学习是实现人工智能的一种方式,而自然语言处理是机器学习的一个应用方向。
01
—
自然语言处理
要搞明白什么是自然语言处理,首先要搞明白什么是语言?
从狭义上来讲,语言就是人类之间的一种交流方式;而语言又是不断演化的过程,所以随着人类文化而自然演化的语言就叫做自然语言。
但从广义上来讲,语言是群体之间的一种交流方式;人类之间交流有人类的语言,其它动物之间也有它们的语言,比如蚂蚁的信息素,蜜蜂的舞蹈就是这些物种之间的“语言”。
而计算机编程语言就是人类与计算机交流的语言,比如c,java,javascript,python等。
那为什么需要自然语言处理?
自然语言处理是人工智能领域的一个重要分支,自语语言处理的目的是想让计算机不需要编程,就可以直接“听懂”人类语言,然后和人类进行交流的方法。
自然语言处理涉及到语言学和计算机科学等多个学科,自然语言处理是人工智能领域的分支,但并不是人工智能领域的子集。
因此,自然语言处理是一个多学科交叉的领域。
简单来说,自然语言处理就是实现人类与人工智能之间交流的一个桥梁,让人工智能可以像正常的人类一样交流。
那么如果不要自然语言处理,继续使用编程的方式和人工智能进行交流行不行?
理论上是可以的,但是继续用编程的方式和人工智能进行交流,就会大大提高人工智能的使用门槛,因为你只有懂编程才能和人工智能进行交流。
而且,编程的方式没办法让人工智能按照人类的思维方式进行学习与思考,这样就有可能无法实现真正的人工智能。
技术的发展是为了更加方便的工作与生活,这也是自然语言处理为什么是人工智能领域很重要的一个组成部分的原因。
而自然语言处理的目的是让人类和计算机或者人工智能之间能够用更加符合人类的方式进行交流,人类用自然语言说,计算机用自然语言回答;
那么具体应该怎么实现呢?
在传统自然语言处理领域,需要建立语言模型,比如语法,语义,分词,词性标注等流程。
而随着技术的发展,人工智能领域的另一项重要技术——机器学习(Machine Learning)出现了;特别是深度学习的出现,神经网络模型大放异彩。
因此,就有人用神经网络技术来研究自然语言处理。
这也是为什么在openAI公司的GPT(Generative Pre-trained Transformer)模型的介绍中说,openAI的GPT模型是一种自然语言处理技术,基于预训练的深度学习模型。
因此,openAI的GPT模型更确切的说,它只是一个用来处理自然语言的神经网络模型;而不是真正意义上的人工智能。当然,现在很多人已经把大模型等同于人工智能。
02
—
机器学习
前面说了现在的自然语言处理是基于神经网络实现的,那么现在就来说一下神经网络或者说是机器学习。
在之前关于人工智能的文章中说过,人工智能是一种让计算机拥有人类智能的技术和方法论;也就是说,任何一种能够让计算机拥有人类智慧的技术或方法都属于人工智能。
而机器学习是实现人工智能的一种方式,也就是说除了机器学习之外还有其它的方式方法来实现人工智能,比如符号理论。
而深度学习又是机器学习中的一种具体方法,而其具体表现形式就是神经网络模型。
其关系如下:
机器学习的重点在于 学习,而难点在于怎么让机器像人一样学习;我们都知道,刚出生的人类婴儿是没有智慧的,而随着孩子的成长,通过教育与生活实践,慢慢才拥有了智慧。
所以,机器学习技术就是让机器具有像人类一样的学习能力。
为什么在前面自然语言处理中说,人工智能技术没有自然语言也可以呢?
就类似于人类与动物,比如猴子和狼;猴子和狼都属于很聪明的动物,但它们并不会讲人类的语言,也无法和人类进行交流,但是其可以通过它们自己的方式去学习和思考。
但不论是猴子还是狼或者其它动物,它们永远无法具有人类的智慧,就是因为它们没有人类的学习和思考方式。所以,它们的智慧相对人类来说就显得很低。
因此,不论是为了人类与计算机更加方便的交流,还是实现真正的人工智能技术,自然语言处理都是不可避免的一关。
而机器学习的应用领域远不止自然语言处理这一项,比如计算机视觉,语音识别,数据挖掘等等。
而随着机器学习技术的发展,其会与更多的应用场景相结合,比如工业领域,智能制造,金融,法律,医疗等。
只不过目前主要的形式,还是以神经网络为代表的机器学习模型作为重要发展方向。
总结
人工智能是一项更加宽泛的技术,除了机器学习和自然语言处理之外,还有包括计算机视觉,语音识别,数据处理等领域;
而机器学习是人工智能的一种实现方式,深度学习是机器学习的一种方法,神经网络是一种具体的表现形式。
而自然语言处理即是人工智能的一个领域,又可以使用机器学习技术作为其实现方法;
机器学习除了能用来进行自然语言处理之外,也可以应用在金融,医疗,法律等民生领域。
自然语言处理技术的发展,又为构建真正意义上的人工智能提供技术支撑。