探秘深度神经网络的训练与推理：以“认猫”为例

callmewhy 发布于2019-04-25 18:03 / 1809人阅读

摘要：如何理解神经网络训练与推理深度神经网络和我们人类一样，为了学习工作技能需要接受教育。这样的技术意味着，用户可以随时使用神经网络的推理能力。

人工智能的智能水平在某些领域已经十分强大，但是人工智能究竟是如何变得智能的呢？是否和人一样需要有人给它上课、需要没日没夜的做作业呢？今天小编就为大家探秘一下深度神经网络的训练和推理，看看聪明的神经网络养成记，比如说它是如何认识猫的。

如何理解神经网络训练与推理？

深度神经网络和我们人类一样，为了学习工作技能需要接受教育。经过训练的神经网络利用学习到的知识，以精简的应用程序，进行数字世界中的工作：比如确认图像、语音识别、检测血液病，甚至化身为导购，建议你接下来该买哪双鞋子——凡是你想的出来的事物，人工智能似乎都能胜任。

经过训练之后的神经网络，能够根据新的数据对事物进行猜测和推断、举一反三，这样的行为在人工智能字典中，称之为“推理”。

训练就是人工智能进行推理的前提

想想也确实如此，这不正是我们大部分人获取和运用自身知识的方法么。

但是

神经网络的教育过程或训练与我们人类又不一样，神经网络是根据类似我们的大脑中，神经元之间的所有相互关联的生理状态来进行建模的。在我们的大脑中，任何神经元都可以与相隔一定物理距离的任何其他神经元进行连接，但是人工神经网络拥有独立层级、连接和数据传输方向。

在进行神经网络训练时，训练数据放在网络第一层，单个神经元会根据执行的任务，向输入的内容分配权重，判断其正确或错误程度。

举个例子

现在有个任务要识别一张图像是不是猫。在图像识别网络中，不同层级可能是这样“推理”的：

第一层：寻找对象的边缘

第二层：了解这些边缘形成的各种形状，比如是矩形还是圆形

第三层：寻找特定特征，例如明亮眼睛和塌鼻子

……

每一层将图像传送至下一层，直至最后一层，并通过计算所有权重得到最终的结果。

但不同的是！神经网络是同时捕捉所有训练图像，进行权重计算，从而确定对象是否为猫的结论——因此，从神经网络训练算法中得到的结论就是简单的“Yes”或“No”。

如果算法向神经网络告知图像是错误的，然后该错误会传回网络的各层级，并开始猜测对象是不是别的什么，但是神经网络并不会知道，如果图像里的不是猫，会是别的什么东西？（就像是没见过除猫以外，其他动物的小孩一样……）。在我们提到的识别猫这个例子中，神经网络的各层收到传回的信号之后，就开始考察图像中有没有其他与猫有关的属性，并权衡各个层级中得到的结论。然后猜测、猜测、再猜测。直到几乎每次的猜测都可以获得正确的权重和答案的时候，神经网络才会确定——这家伙就是猫，没跑了！

终于“猜到”朕是猫了吗？

神经网络训练是吃“计算能力”的怪兽

通过训练后，神经网络里所有数据权重都根据训练进行了平衡，从而打造了一个经过精细调谐的体系。问题是，当涉及到计算时，它也是一个吃不饱的怪兽。曾在谷歌和斯坦福训练人工智能、现担任百度硅谷实验室首席科学家的Andrew Ng表示，训练一个百度中文语音识别模型不仅需要4 terabytes的训练数据，而且在整个训练周期内，还需要进行20 exaflops次的计算。

想象一下，这样的计算量要在智能手机上进行，可能吗？因此这时候就需要推理的能力了。

推理让神经网络轻巧敏捷、普惠大众

如果任何人在现实生活中，要用上神经网络某些训练后获得的技能，那么就需要它将这样的技能快速应用起来，从而巩固训练结果，做到举一反三，这就是推理：获取一定量的数据，并快速反馈正确的答案。

如何利用推理？只需打开智能手机就行。推理会将深度学习用于从语音识别到快照分类等一切事物中。

一种方法是寻找将神经网络中的各个层级融合为单一计算的手段。它类似于数据图像发生的压缩，虽然图片被压缩，但是在一定的分辨率中，人眼是识别不出区别的。推理也是一样，“压缩后”的神经网络能够提供与“未压缩”神经网络几乎相同的预测精度，但是前者更能满足在不同设备上运行的需求。

这样的技术意味着，用户可以随时使用神经网络的推理能力。不论是你智能手机上的语音助手，还是谷歌、百度所作的语音识别、垃圾邮件过滤，Facebook的图像识别，亦或是亚马逊及Netflix的智能推荐都依赖于推理的能力。

未来，我们将看到这些模型和应用将变得更加聪明、快捷和准确。训练将变得不那么繁琐，推理的能力将为我们生活的各个方面带来新的便利。因此，写到这里，对于未来的年轻一代，小编悟道了一句话——不想成为傻瓜，就赶紧去学习吧！

欢迎加入本站公开兴趣群

商业智能与数据分析群

兴趣范围包括各种让数据产生价值的办法，实际应用案例分享与讨论，分析工具，ETL工具，数据仓库，数据挖掘工具，报表系统等全方位知识

QQ群：81035754

云服务器 GPU云服务器机器学习与深度学习的区别探秘以a开头的编程语言以深圳为机房的云vps

文章版权归作者所有，未经允许请勿转载,若此文章存在违规行为，您可以联系管理员删除。

转载请注明本文地址：https://www.ucloud.cn/yun/4381.html

首次披露！阿里线下智能方案进化史

摘要：前言阿里巴巴机器智能实验室线下智能团队从年底开始涉及线下智能领域，从算法工程产品化业务落地多个方面入手，与合作伙伴们一起取得了一些小小的成绩。目前，该套工具作为推荐的量化工具广泛应用在阿里集团内多个线下业务场景中。 showImg(https://segmentfault.com/img/remote/1460000019246850); 阿里妹导读：AI 技术已经从互联网走向零售、...

keelii 2019-06-26 19:00 评论0 收藏0
阿里副总裁玄难：藏经阁计划首次在阿里应用落地

摘要：在全国知识图谱与语义计算大会上，阿里巴巴集团副总裁藏经阁计划阿里负责人墙辉玄难宣布藏经阁计划首次在阿里应用落地，以及首次披露大规模知识构建技术细节，并从三个方面进行了解读。 2018年4月，阿里联合清华大学、浙江大学、中科院自动化所、中科院软件所、苏州大学等五家机构，联合发布藏经阁（知识引擎）研究计划，同时还宣布打算用一年时间初步建成首个开放的知识引擎服务平台，服务社会。在全国知识图...

CompileYouth 2019-06-21 16:47 评论0 收藏0