计算机视觉和人类视觉有相似的不足

DataPipeline 发布于2019-06-26 18:13 / 2834人阅读

摘要：机器视觉背后得深卷积神经网络的结构和大脑负责视觉得结构之间有着惊人的相似之处。这结果显示了使用卷积神经网络来帮助探测人类认知过程的可能性。

深卷积神经网络浪潮席卷人工智能领域。这些程序在某些方面能比人类做得更好，从面部和物体识别到玩古老的游戏－－围棋等。

神经网络受到了由大脑结构的启发。机器视觉背后得深卷积神经网络的结构和大脑负责视觉得结构之间有着惊人的相似之处。其中的一个进化了数百万年，另一个是仅发展了短短几十年。但似乎都以同样的方式工作。

这引发了一个有趣的问题，如果机器视觉和人类视觉用类似的方式工作，他们是否也有同样的不足？人类和机器是否不能解决同样的视觉挑战？

首先是一些背景信息。在脑中负责视力的神经在有很多层，他们被认为从图像中提取逐步的详细信息，如运动，形状，颜色，等等。每一层是一个庞大的神经元网络。

深卷积神经网络具有类似的结构。他们也有层的结构，并且每个层由模仿大脑神经元的电路结构组成，神经网络的术语就是这么来的。

经过多次试验，计算机科学家们发现，这些神经网络层识别图像最好的时候，每个层逐步地提取更多信息。而且当他们看每个层的多带带行为时，他们发现和大脑神经层有显著的相似性。

为了找到答案，Kheradpisheh 教授和他的合作人员用了四种物件的识别难度各异的图片，然后测试人类和深卷积神经网络的识别能力。

该团队让 89 个人每人识别 960 个图像。研究人员使用每个实验者反应的速度和准确性作为他们识别图片的测量。

该小组还在两个用于物体识别的最强大的深度卷积网络进行了等效试验，一个在加拿大多伦多大学开发，另一个在牛津大学开发。

结果是非常有趣的。 “我们发现，人类和深卷积神经网络很大程度上每一种变化的相对困难程度详细，” Kheradpisheh教授说 “3d旋转是迄今为止最难识别的，其次是放大缩小，然后在平面内旋转。”

这结果显示了使用卷积神经网络来帮助探测人类认知过程的可能性。这项技术或许可以在某些图像的设计中应用，如空中交通管制，紧急出口，使用救生设备等的指令等。

原文连接： https://www.technologyreview.com/s/601387/why-machine-vision-is-flawed-in-the-same-way-as-human-vision/

云服务器 GPU云服务器图像识别和计算机视觉计算机视觉和图像识别计算机视觉图像识别和机器视觉

文章版权归作者所有，未经允许请勿转载,若此文章存在违规行为，您可以联系管理员删除。

转载请注明本文地址：https://www.ucloud.cn/yun/19603.html

机器视觉与深度神经网络：洗去浮华，一窥珠玑

摘要：近年来机器学习领域随着深度神经网络的崛起而迎来新一波的春天，尤其最近两年无论学界还是业界，或是各大媒体，甚至文盲老百姓都言必称智能。近年来机器学习、AI领域随着深度神经网络（DNN）的崛起而迎来新一波的春天，尤其最近两年无论学界还是业界，或是各大媒体，甚至文盲老百姓都言必称智能。关于这方面，可讨论的东西实在太多太多，我不想写成一本厚厚的书，所以在此仅以机器学习在计算机视觉和图像领域的人脸识...

Joonas 2019-04-25 18:00 评论0 收藏0
关于深度学习中的注意力机制，这篇文章从实例到原理都帮你参透了

摘要：本文以机器翻译为例，深入浅出地介绍了深度学习中注意力机制的原理及关键计算机制，同时也抽象出其本质思想，并介绍了注意力模型在图像及语音等领域的典型应用场景。最近两年，注意力模型（Attention Model）被广泛使用在自然语言处理、图像识别及语音识别等各种不同类型的深度学习任务中，是深度学习技术中最值得关注与深入了解的核心技术之一。本文以机器翻译为例，深入浅出地介绍了深度学习中注意力机制...

iliyaku 2019-04-25 18:20 评论0 收藏0
用于视觉任务的 CNN 为何能在听觉任务上取得成功？

摘要：研究证明，用于加工听觉信号的脑区可用于视觉任务。我们已经发现为计算机图像视觉通道开发出来的图形处理单元，也可以用于加快语音和语言的机器学习任务。最初针对视觉信号设计出来的 CNN 也能处理听觉信号，最终帮助机器倾听和更好地理解我们。 CNN 在某些程度上能迁移学习，掌握多种模式的共同特征。有一系列神经网络机器学习方法不只是「有深度的」。在这段时间，针对先进的语音技术和人工智能的神经网络变得...

lieeps 2019-04-25 18:04 评论0 收藏0
人工智能缺陷与误觉：让机器产生幻觉的「怪异事件」

摘要：列车高速撞上来，压碎了这辆自动驾驶汽车，乘客当场死亡。的计算机科学家阿塔利表示我们可以把这些东西看作是人工智能网络会以某种方式处理的输入信息，但机器在看到这些输入信息后会做出一些意想不到的反应。谷歌大脑正在研发智能机器。简评：如果人工智能犯了错怎么办？乘客看到了停车标志，突然感到一阵恐慌，因为他搭乘的自动驾驶汽车反而开始加速。当他看到前面的铁轨上一列火车向他们疾驰而来时，他张开嘴...

fizz 2019-06-26 18:48 评论0 收藏0
深度学习：推动NLP领域发展的新引擎

摘要：深度学习推动领域发展的新引擎图拥有记忆能力最早是提出用来解决图像识别的问题的一种深度神经网络。深度学习推动领域发展的新引擎图深度神经网络最近相关的改进模型也被用于领域。从2015年ACL会议的论文可以看出，目前NLP最流行的方法还是机器学习尤其是深度学习，所以本文会从深度神经网络的角度分析目前NLP研究的热点和未来的发展方向。我们主要关注Word Embedding、RNN/LSTM/CN...

shiyang6017 2019-04-25 18:02 评论0 收藏0