入门深度学习教程:神经网络基础

什么是深度学习?

深度学习是一种模仿大脑神经元网络的计算机软件。它是基于人工神经网络和表示学习的机器学习的一个子集。之所以称为深度学习,是因为它使用了深度神经网络。这种学习可以是监督学习、半监督学习或无监督学习。

深度学习算法由连接的层构成。

  • 第一层称为输入层
  • 最后一层称为输出层
  • 所有中间的层都称为隐藏层。深度这个词意味着网络连接了两个以上的层。
Deep Learning
什么是深度学习?

每个隐藏层由神经元组成。神经元之间相互连接。神经元将处理然后传播它从上一层接收到的输入信号。下一层神经元接收到的信号强度取决于权重、偏置和激活函数。

网络消耗大量的输入数据,并通过多层进行操作;网络可以在每一层学习数据越来越复杂的特征。

深度学习过程

深度神经网络在许多任务中都能提供最先进的准确性,从目标检测到语音识别。它们可以自动学习,而无需程序员明确编码的预定义知识。

Deep Learning Process
深度学习过程

要理解深度学习的概念,可以想象一个家庭,有婴儿和父母。蹒跚学步的孩子用小手指着物体,总是说“猫”这个词。他的父母关心他的教育,不断告诉他“是的,那是猫”或“不是,那不是猫”。婴儿坚持指着物体,但对于“猫”的识别越来越准确。这个小孩子,内心深处,并不知道为什么他能说出是不是猫。他只是通过整体观察宠物,并不断关注诸如尾巴或鼻子等细节,来学习识别猫的复杂特征,从而做出决定。

神经网络的工作原理非常相似。每一层代表一个更深层次的知识,即知识的层次结构。一个有四层的神经网络比一个有两层的网络能学习到更复杂的特征。

学习分为两个阶段

第一阶段:第一阶段包括对输入进行非线性变换,并创建统计模型作为输出。
第二阶段:第二阶段旨在通过一种称为导数的数学方法来改进模型。

神经网络重复这两个阶段数百到数千次,直到达到可接受的准确度水平。这两个阶段的重复称为一个迭代。

为了举一个深度学习的例子,请看下面的动作,模型正在尝试学习跳舞。训练10分钟后,模型还不知道如何跳舞,看起来像涂鸦。

Deep Learning Process

经过48小时的学习,计算机掌握了跳舞的艺术。

Deep Learning Process

神经网络分类

浅层神经网络:浅层神经网络在输入和输出之间只有一个隐藏层。

深度神经网络:深度神经网络包含一个以上的层。例如,Google LeNet图像识别模型有22层。

如今,深度学习的应用非常广泛,例如无人驾驶汽车、手机、谷歌搜索引擎、欺诈检测、电视等等。

深度学习网络类型

现在,在本深度神经网络教程中,我们将学习深度学习网络类型

Types of Deep Learning Networks
深度学习网络类型

前馈神经网络

最简单的一种人工神经网络。在这种架构中,信息只向前流动。这意味着信息从输入层开始,经过“隐藏”层,最终到达输出层。网络

没有循环。信息在输出层停止。

循环神经网络(RNN)

RNN是一种多层神经网络,可以将其信息存储在上下文节点中,从而使其能够学习数据序列并输出一个数字或另一个序列。简而言之,它是一种人工神经网络,其神经元之间的连接包含循环。RNN非常适合处理输入序列。

Recurrent Neural Networks

循环神经网络

例如,如果任务是预测句子“Do you want a…………?”的下一个词

  • RNN神经元将接收一个指向句子开头的信号。
  • 网络接收单词“Do”作为输入,并生成一个数字向量。该向量被反馈给神经元,为网络提供记忆。此阶段有助于网络记住它接收了“Do”并且这是它收到的第一个单词。
  • 网络将类似地处理下一个单词。它接收单词“you”和“want”。在接收每个单词时,神经元的状态都会更新。
  • 最后一个阶段发生在接收到单词“a”之后。神经网络将为可以完成句子的每个英语单词提供一个概率。一个训练有素的RNN可能会为“café”、“drink”、“burger”等分配高概率。

RNN的常见用途

  • 帮助证券交易员生成分析报告
  • 检测金融报表合同中的异常情况
  • 检测信用卡欺诈交易
  • 为图像提供字幕
  • 驱动聊天机器人
  • RNN的标准用途是当从业人员处理时间序列数据或序列(例如,音频记录或文本)时。

卷积神经网络(CNN)

CNN是一种多层神经网络,具有独特的架构,旨在在每一层提取数据越来越复杂的特征以确定输出。CNN非常适合感知任务。

Convolutional Neural Network

卷积神经网络

CNN主要用于非结构化数据集(例如图像)并且从业人员需要从中提取信息的情况。

例如,如果任务是预测图像字幕

  • CNN接收一张猫的图像,这张图像在计算机术语中是像素的集合。通常,灰度图像有一个层,彩色图像有三个层。
  • 在特征学习(即隐藏层)期间,网络将识别出独特的特征,例如猫的尾巴、耳朵等。
  • 当网络充分学习识别图像后,它可以为它认识的每张图像提供概率。具有最高概率的标签将成为网络的预测。

强化学习

强化学习是机器学习的一个子领域,其中系统通过接收虚拟的“奖励”或“惩罚”进行训练,本质上是通过试错学习。Google的DeepMind使用强化学习在围棋游戏中击败了人类冠军。强化学习也用于视频游戏,通过提供更智能的机器人来改善游戏体验。

一些最著名的算法是

  • Q-learning
  • 深度Q网络
  • 状态-动作-奖励-状态-动作(SARSA)
  • 深度确定性策略梯度(DDPG)

深度学习应用示例

现在,在本深度学习入门教程中,让我们学习深度学习的应用

金融AI

金融科技行业已经开始利用AI来节省时间、降低成本并增加价值。深度学习通过使用更强大的信用评分正在改变贷款行业。信用决策者可以利用AI进行强大的信用贷款申请,以实现更快、更准确的风险评估,利用机器智能来考虑申请人的品格和能力。

Underwrite是一家金融科技公司,为信贷机构提供AI解决方案。underwrite.ai利用AI来检测哪些申请人更有可能偿还贷款。他们的方法远远优于传统方法。

人力资源AI

运动服装公司Under Armour借助AI彻底改变了招聘并使候选人体验现代化。事实上,Under Armour将其零售店的招聘时间缩短了35%。2012年,Under Armour因其日益增长的受欢迎程度而获得了极大的兴趣。他们平均每月收到30,000份简历。阅读所有这些申请并开始筛选和面试过程耗时太长。漫长的招聘和入职流程影响了Under Armour零售店完全配备人员、快速投入运营的能力。

当时,Under Armour拥有所有“必备”的HR技术,例如用于招聘、申请、跟踪和入职的交易解决方案,但这些工具还不够有用。Under Armour选择了**HireVue**,一家提供HR解决方案的AI提供商,用于进行即时和现场面试。结果令人惊叹;他们成功地将填补职位的平均时间缩短了35%。反过来,他们招聘了更高质量的员工。

营销AI

AI是客户服务管理和个性化挑战的宝贵工具。作为AI技术应用的结果,呼叫中心管理和呼叫路由中的语音识别得到了改进,从而为客户提供了更无缝的体验。

例如,对音频进行深度学习分析可以使系统评估客户的情感语调。如果客户对AI聊天机器人的反应不佳,系统可以将对话重新路由给真正的、人类操作员来处理问题。

除了上述三个深度学习示例外,AI还在其他领域/行业中得到广泛应用。

为什么深度学习很重要?

深度学习是将预测转化为可操作结果的强大工具。深度学习在模式发现(无监督学习)和基于知识的预测方面表现出色。大数据是深度学习的燃料。两者结合后,组织可以在生产力、销售、管理和创新方面获得前所未有的成果。

深度学习可以优于传统方法。例如,在图像分类方面,深度学习算法的准确性比机器学习算法高41%,在面部识别方面高27%,在语音识别方面高25%。

深度学习的局限性

现在,在本神经网络教程中,我们将学习深度学习的局限性

数据标注

目前大多数AI模型是通过“监督学习”进行训练的。这意味着人类必须对底层数据进行标注和分类,这可能是一项庞大且容易出错的任务。例如,开发自动驾驶汽车技术的公司正在雇佣数百人来手动注释来自原型车辆的数小时视频馈送,以帮助训练这些系统。

获取海量训练数据集

研究表明,像CNN这样的简单深度学习技术在某些情况下可以模仿医学和其他领域的专家知识。然而,当前的机器学习浪潮需要训练数据集,这些数据集不仅已标注,而且还足够广泛和通用。

深度学习方法需要数千次观察才能使模型在分类任务上变得相对良好,在某些情况下,还需要数百万次才能达到人类水平。不出所料,深度学习在大型科技公司中很受欢迎;它们利用大数据积累PB级数据。这使得它们能够创建令人印象深刻且高度准确的深度学习模型。

解释一个问题

大型复杂模型难以用人类语言来解释。例如,为什么会做出某个特定决定。这是某些AI工具的应用缓慢的原因之一,尤其是在可解释性有用或必需的应用领域。

此外,随着AI应用的扩展,监管要求也可能推动对更具可解释性的AI模型的需求。

摘要

深度学习概述:深度学习是人工智能的最新技术。深度学习架构由输入层、隐藏层和输出层组成。深度这个词意味着存在两个以上的全连接层。

存在大量的神经网络,每种架构都设计用于执行特定的任务。例如,CNN在处理图像方面非常出色,RNN在处理时间序列和文本分析方面能提供令人印象深刻的结果。

深度学习现在活跃在不同领域,从金融到营销、供应链和营销。大公司是第一个使用深度学习的公司,因为它们已经拥有大量数据。深度学习需要拥有广泛的训练数据集。