资讯专栏INFORMATION COLUMN

深入浅出自动驾驶(二):卷积神经网络(CNN)

henry14 / 3238人阅读

摘要:如何识别一张图像如下图片所示,你要如何识别是一只狗呢我们可以把眼睛鼻子嘴都分开,而后分别识别出来,最后将所有的特征组合起来,就可以看出来是一只狗啦比如在这幅图中,你就可以分别识别出眼睛鼻子金毛如下图所示让我们进一步分析,如何识别眼睛鼻子和毛

如何识别一张图像

如下图片所示,你要如何识别是一只狗呢?

我们可以把眼睛、鼻子、嘴都分开,而后分别识别出来,最后将所有的特征组合起来,就可以看出来是一只狗啦
比如在这幅图中,你就可以分别识别出
1 眼睛
2 鼻子
3 金毛
如下图所示

让我们进一步分析,如何识别眼睛、鼻子和毛发呢?以金毛的鼻子为例,如何才能知道这是一个鼻子呢?我们可以用鼻子上方的弧线和鼻孔来定义一个鼻子

鼻子上方的弧线

鼻孔

这就是CNN的处理逻辑了,它首先识别简单线条和曲线,而后是形状和区块...最后组合起来,识别这个物体,是狗,还是猫,或是其它物体。

在我们的例子中,可以做入下分解
1 简单的线条,比如曲线、直线等等
2 复杂的物体,比如鼻子、眼睛等等
3 作为狗的整体

最令人兴奋的是我们根本不用去手动分解,CNN网络自己就能够做了,如下图所示

什么是卷积神经网络

假设你有一张照片,如图所示

一张猫的照片可以表示为一个有width,有height以及厚度为3(RGB)的薄饼。然后我们在图片上取出X大小的一个方块,并把它映射成高维空间的深度为K的向量

而后我们移动这个方块

最终得到一个宽度为width,高度微height,深度为k的图像,这就称为卷积了

卷积的思想是将图像的特征逐步的映射到深度中去(图像特征),以此把图像特征全部连接起来,然后就可以判断分类的类型(图像的类型)

动态图

为何要使用卷积神经网络

CNN在图像领域用的比较多,以一张1000*1000像素的图像为例,如果使用单纯的神经网络,加上隐藏层,共需要1000000x1000000 = 10^12个参数,这样就太多了,基本没法使用神经网络训练,所以必须减少参数个数,这是使用卷积神经网络一个非常重要的原因
我们也可以从另一个角度来看:一张图片上不是所有的像素(特征)都有效,只需要取某一个区块内的代表像素就可以了,局部区块的像素关联性较强,其它的关联较弱

资源

斯坦福:http://cs231n.github.io/
freebook:http://neuralnetworksanddeepl...
http://deeplearningbook.org/

文章版权归作者所有,未经允许请勿转载,若此文章存在违规行为,您可以联系管理员删除。

转载请注明本文地址:https://www.ucloud.cn/yun/18183.html

相关文章

  • GitChat · 人工智能 | 自动驾驶的技术架构和生态发展

    摘要:目前每年全球有万人死于车祸,损失,相关于很多国家的,自动驾驶可以很大效率的减少车祸,拯救生命。美国汽车工程师协会和美国高速公路安全局将自动驾驶技术进行了分级。特定场所的高度自动驾驶。这叫基于规则的一种自动驾驶,简单的。 来自 GitChat 作者:刘盼更多IT技术分享,尽在微信公众号:GitChat技术杂谈 进入 GitChat 阅读原文我们先以汽车在现代科技领域的演进来开始这次的ch...

    X1nFLY 评论0 收藏0
  • 机器学习

    摘要:用离散信一文清晰讲解机器学习中梯度下降算法包括其变式算法无论是要解决现实生活中的难题,还是要创建一款新的软件产品,我们最终的目标都是使其达到最优状态。 提高驾驶技术:用GAN去除(爱情)动作片中的马赛克和衣服 作为一名久经片场的老司机,早就想写一些探讨驾驶技术的文章。这篇就介绍利用生成式对抗网络(GAN)的两个基本驾驶技能: 1) 去除(爱情)动作片中的马赛克 2) 给(爱情)动作片中...

    wums 评论0 收藏0
  • 机器学习

    摘要:用离散信一文清晰讲解机器学习中梯度下降算法包括其变式算法无论是要解决现实生活中的难题,还是要创建一款新的软件产品,我们最终的目标都是使其达到最优状态。 提高驾驶技术:用GAN去除(爱情)动作片中的马赛克和衣服 作为一名久经片场的老司机,早就想写一些探讨驾驶技术的文章。这篇就介绍利用生成式对抗网络(GAN)的两个基本驾驶技能: 1) 去除(爱情)动作片中的马赛克 2) 给(爱情)动作片中...

    jonh_felix 评论0 收藏0
  • AutoML:自动设计自动驾驶机器学习模型

    摘要:为此,我们的研究员编写了一个自动搜索算法,在卷积网络架构中探索数百种不同的单元组合,训练和评估我们的分割任务模型。鉴于初步尝试取得的成功,我们将相同的搜索算法应用于两个与交通车道的检测和定位相关的附加任务。 译者说 本人介绍了谷歌自动驾驶子公司Waymo在AutoML领域的研究成果。自动驾驶对神经网络模型的准确性和延迟要求,这要求工程师手动调优不同的神经网络架构,这不仅花费了大量的时间...

    wyk1184 评论0 收藏0
  • 从零开始的无人驾驶 1

    摘要:霍夫变化是图像变化中的经典算法,主要用来寻找图像中符合某种特征的集合,说白了就是检测直线圆椭圆。定向梯度直方图相比于之前的特征,特征更加健壮,并且无视颜色的影响。行为克隆算是的一种。 Lanes Finding with Computer Vision 利用计算机视觉进行道路检测,一般包括6部分:摄像头校正(camera calibration)、图像失真校正(distortion c...

    marek 评论0 收藏0

发表评论

0条评论

henry14

|高级讲师

TA的文章

阅读更多
最新活动
阅读需要支付1元查看
<