机器学习与深度学习的区别
机器学习与深度学习的关键区别
机器学习和深度学习的主要区别在于
- 机器学习在小/中型数据集上表现出色,而深度学习在大数据集上表现出色
- 机器学习可以在低端机器上运行,而深度学习需要强大的机器,最好是带有GPU。
- 机器学习的执行时间从几分钟到几小时不等,而深度学习则需要长达几周的时间。
- 使用机器学习,您需要的数据量少于深度学习。深度学习需要大量多样化的数据来识别底层结构。

什么是人工智能?
人工智能 (Artificial Intelligence) 是计算机科学的一个分支,通过该分支,机器被编程并赋予了像人类和动物一样思考和模仿行动的认知能力。人工智能的基准是人类在推理、语音、学习、视觉和解决问题方面的智能,但这在未来仍然遥不可及。
人工智能有三个不同的级别
1) 狭义人工智能:当机器在执行特定任务时比人类做得更好时,这种人工智能被称为狭义人工智能。目前人工智能的研究正处于这个阶段
2) 通用人工智能:当人工智能能够以与人类相同的准确度水平执行任何智力任务时,就达到了通用状态
3) 超级人工智能:当人工智能在许多任务上都能胜过人类时,它就是超级人工智能
早期人工智能系统使用了模式匹配和专家系统。
什么是机器学习 (ML)?
机器学习 (Machine Learning) 是一种人工智能,其中计算机经过训练以自动化对人类来说非常繁琐或不可能的任务。它是根据对计算机算法的研究来分析、理解和识别数据模式的最佳工具。机器学习可以在最少的人工干预下做出决策。
在比较人工智能与机器学习时,机器学习使用数据来喂养算法,该算法可以理解输入和输出之间的关系。当机器完成学习后,它可以预测新数据点的价值或类别。
什么是深度学习 (DL)?
深度学习是一种模仿大脑神经元网络的计算机软件。它是机器学习的一个子集,之所以称为深度学习,是因为它使用了深度神经网络。机器使用不同的层来从数据中学习。模型的深度由模型中的层数表示。深度学习是人工智能方面的新技术。在深度学习中,学习阶段是通过神经网络完成的。神经网络是一种层堆叠在一起的架构
机器学习和深度学习的区别
以下是深度学习与机器学习的关键区别
参数 | 机器学习 | 深度学习 |
---|---|---|
数据依赖性 | 在小/中型数据集上表现出色 | 在大数据集上表现出色 |
硬件依赖性 | 可以在低端机器上运行。 | 需要强大的机器,最好是带有GPU:深度学习执行大量的矩阵乘法 |
特征工程 | 需要理解代表数据的特征 | 无需理解代表数据的最佳特征 |
执行时间 | 从几分钟到几小时 | 长达数周。神经网络需要计算大量的权重 |
可解释性 | 有些算法易于解释(逻辑回归、决策树),有些几乎不可能(SVM、XGBoost) | 困难到不可能 |
何时使用机器学习或深度学习?
参数 | 机器学习 | 深度学习 |
---|---|---|
训练数据集 | 小型 | 大型 |
选择特征 | 是 | 否 |
算法数量 | 许多 | 少数 |
训练时间 | Short | Long |
使用机器学习,您需要的数据量少于深度学习。深度学习需要大量多样化的数据来识别底层结构。此外,机器学习可以提供更快的训练模型。大多数先进的深度学习架构可能需要几天到一周的时间来训练。深度学习优于机器学习的优势在于其高准确性。您无需了解哪些特征最能代表数据;神经网络能够学习如何选择关键特征。在机器学习中,您需要自己选择要包含在模型中的特征。
机器学习流程
想象一下,您需要构建一个能识别对象的程序。要训练模型,您将使用一个分类器。分类器利用对象的特征来尝试识别它所属的类别。
在这个例子中,分类器将训练来检测图像是否为
- 自行车
- 船
- 汽车
- 飞机
以上四种对象是分类器需要识别的类别。要构建分类器,您需要一些数据作为输入并为其分配一个标签。算法将获取这些数据,找到一个模式,然后将其分类到相应的类别中。
这项任务被称为监督学习。在监督学习中,您提供给算法的训练数据包含一个标签。
训练算法需要遵循一些标准步骤
- 收集数据
- 训练分类器
- 进行预测
第一步至关重要,选择正确的数据将决定算法的成功或失败。您选择用来训练模型的数据称为特征。在对象示例中,特征是图像的像素。
每个图像是一行数据,而每个像素是一列。如果您的图像大小为 28×28,则数据集包含 784 列 (28×28)。下图显示了每张图片如何被转换为一个特征向量。标签告诉计算机图像中是什么对象。
目标是利用这些训练数据对对象类型进行分类。第一步是创建特征列。然后,第二步是选择一个算法来训练模型。训练完成后,模型将预测哪个图像对应于哪个对象。
之后,就可以轻松地使用该模型来预测新图像了。对于输入到模型中的每个新图像,机器都会预测它所属的类别。例如,一个完全新的、没有标签的图像通过模型进行处理。对于人类来说,很容易将图像可视化为一辆汽车。机器利用其先前的知识也预测该图像是一辆汽车。
深度学习流程
在深度学习中,学习阶段是通过神经网络完成的。神经网络是一种层堆叠在一起的架构。
考虑上面相同的图像示例。训练集将被输入到一个神经网络
每个输入进入一个神经元,并乘以一个权重。乘法的结果流向下一层并成为输入。这个过程对网络的每一层重复进行。最后一层称为输出层;它为回归任务提供实际值,为分类任务提供每个类别的概率。神经网络使用数学算法来更新所有神经元的权重。当权重值输出接近现实时,神经网络就完全训练好了。例如,一个训练良好的神经网络可以比传统神经网络以更高的准确性识别图片中的对象。
使用深度学习自动化特征提取
一个数据集可以包含几十到几百个特征。系统将从这些特征的相关性中学习。但是,并非所有特征对算法都有意义。机器学习的一个关键部分是找到一组相关的特征来使系统学习到一些东西。
在机器学习中执行此部分的一种方法是使用特征提取。特征提取将现有特征组合起来,创建一组更相关的特征。这可以通过 PCA、T-SNE 或任何其他降维算法来完成。
例如,在图像处理中,从业人员需要手动从图像中提取特征,如眼睛、鼻子、嘴唇等。这些提取的特征被输入到分类模型中。
深度学习解决了这个问题,特别是对于卷积神经网络。神经网络的第一层将学习图像中的小细节;后续层将结合先前知识以生成更复杂的信息。在卷积神经网络中,特征提取是通过使用滤波器来完成的。网络将滤波器应用于图像,以查看是否存在匹配,即特征的形状与图像的某个部分相同。如果存在匹配,网络将使用该滤波器。因此,特征提取过程是自动完成的。
摘要
人工智能是赋予机器认知能力。在比较人工智能与机器学习时,早期人工智能系统使用了模式匹配和专家系统。
机器学习的理念是机器可以在没有人为干预的情况下学习。机器需要找到一种方法来学习如何根据数据来解决任务。
深度学习是人工智能领域的突破。当有足够的数据进行训练时,深度学习会取得令人印象深刻的结果,尤其是在图像识别和文本翻译方面。主要原因是特征提取是在网络的各个层中自动完成的。