深度学习实践教程
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

1.1 人工智能、机器学习与深度学习

1.1.1 人工智能简介

人工智能(Artificial Intelligence,AI)是计算机学科的一个分支,被人们称为21世纪三大尖端技术(基因工程、纳米科学、人工智能)之一。人工智能是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术。人工智能的目的是让计算机能够像人一样思考。人工智能的研究方向包括智能机器人、图像识别、自然语言处理和专家系统等。

1956年夏季,以麦卡塞、明斯基、罗切斯特和申农等为首的一批有远见卓识的年轻科学家聚在一起,共同研究和探讨用机器模拟智能的一系列有关问题,并首次提出“人工智能”这一术语,它标志着“人工智能”这个新兴技术正式诞生。

1997年5月,IBM公司研制的深蓝(Deep Blue)计算机战胜了国际象棋大师卡斯帕罗夫,为人工智能的发展树立了一个新的里程碑。如今,人工智能已经成为很多工科大学生必须学习的课程。在科学家们的不懈努力下,人工智能在我们生活中几乎随处可见。例如,小米手机中的“小爱同学”、苹果手机中的“Siri”都能够帮助我们发送短信、拨打电话、记备忘录等,甚至还能陪我们聊天;特斯拉汽车具有自动驾驶能力、远程OTA升级技术和远程诊断技术;京东的配送机器人能够识别、躲避障碍物,辨别红绿灯,进行路线规划、自动换道、车位识别、自主泊车等;阿里未来酒店无前台,实现让入住人刷脸预定、刷脸入住、刷脸就餐;海底捞饭店的服务机器人能够像服务员一样为顾客提供各种服务。

早期的人工智能技术侧重于计算,如今我们对可自行决策的人工智能应用程序更感兴趣。人工智能可分为两种类型,强人工智能和弱人工智能。强人工智能观点认为机器能像人一样理解、执行任务,如机器人能模仿巴赫作曲。弱人工智能是指只能自动完成某些特定任务的人工智能,如机器人能够完成快速分拣。在人类未来的生活、工作和学习中,无论哪种类型的人工智能,都将扮演越来越重要的角色。

1.1.2 机器学习简介

机器学习(Machine Learning,ML)是人工智能的一个研究领域。机器学习的广义概念是从已知数据中获得规律,并利用规律对未知数据进行预测的方法。机器学习可用于自然语言处理、图像识别、生物信息学及风险预测等,已在工程学、经济学及心理学等多个领域得到了成功应用。

那么,机器是怎样学习的呢?机器学习是一种统计学习方法,机器需要使用大量数据进行学习,从而提取出所需的信息。机器学习主要分为有监督学习(也称监督学习)和无监督学习两种。

1.监督学习

在监督学习中,我们需要为计算机提供一组标签数据,计算机通过训练,从标签数据中提取通用信息或特征信息(特征值,如图1.1所示),以得到预测模型。

图1.1 特征值

监督学习的两种主要类型是分类和回归。

在分类中,计算机被训练后可将一个对象划分为特定的类。分类的一个简单例子是电子邮箱中的垃圾邮件过滤器(简称过滤器),过滤器分析被标记为垃圾邮件的电子邮件,并将它们与新邮件进行比较,如果匹配度超过一定的阈值,这些新邮件将被标记为垃圾邮件。在这个分类过程中,给予过滤器的大量被标注为垃圾邮件的邮件称为训练样本(Training Sample),过滤器对训练样本的特征进行统计和归纳的过程称为训练(Training),训练后总结出的判断标准称为分类模型(简称模型)。

在回归中,计算机使用之前已标记的数据来预测未来。例如,使用气象历史数据预测未来天气;根据教育水平、年龄和居住地预测一个人的年收入。

在无监督学习中,数据是无标签的。无监督学习自动从数据中提取特征值,由于大多数真实世界中的数据都没有标签,因此无监督学习特别有用。无监督学习主要分为聚类和降维两种。聚类用于根据属性和行为对对象进行分组。这与分类不同,因为这些组不是人为提供的。聚类的一个例子是将一个人群划分成不同的子组(如基于年龄和婚姻状况分组),然后进行有针对性的营销。降维通过找到共同点来减少数据集中的变量,大多数大数据可视化技术都使用降维来识别趋势和规则。

图1.2给出了机器学习的分类。

图1.2 机器学习的分类

深度学习是监督学习还是无监督学习呢?答案是两种算法都会使用。但是,无论是监督学习还是无监督学习,都需要使用大量的数据实现对给定数据的处理。

1.1.3 深度学习简介

深度学习是一种利用深度人工神经网络进行分类、预测的技术。人工神经网络(Artificial Neural Network,ANN,简称神经网络)是机器学习的一个分支,其试图模拟人脑,从而自动提取特征值。在应用层面,与一般的机器学习算法相比,深度学习最大的特点是可以处理各种非结构化数据,如图像、视频、文本、音频等。而一般的机器学习算法更适合处理结构化数据,即可以用关系型数据库进行存储、管理和访问的数据。

神经网络是一种人类受到生物神经细胞结构启发而研究出来的算法。图1.3给出了一个深度神经网络(Deep Neural Networks,DNN)的示意图。图中的圆圈表示神经元,连线表示神经突触。信息从网络最左侧的节点输入,经过中间层节点的加工,最终由最右侧的节点输出。神经网络除输入层外从左到右排成多少列就称其有多少层。

神经网络有多少层才算深呢?通常情况下,超过三层的神经网络都可以称为深度神经网络。而目前人们已经可以实现1000多层的深度神经网络了。

到此,我们对人工智能、机器学习、深度学习这三个概念做了简单介绍。图1.4把它们之间的关系表述得一目了然。

图1.3 深度神经网络的示意图

图1.4 人工智能、机器学习、深度学习的关系