摘要:目前谷歌的系统使用深度神经网络,它被训练来预测子关键字目标。通过平均不同局部时间和频率区域的的输出来捕获参数少得多的平移不变性。特征提取和后验处理阶段与第节保持相同。
目录
Convolutional neural networks for small-footprint keyword spotting
Sainath, T. and Carolina Parada. “Convolutional neural networks for small-footprint keyword spotting.” INTERSPEECH (2015).
大家若参考该文章,请记得添加引用说明
(1) cnn比起DNN参数少,性能好,
(2) 我们在工作中考虑两个不同的应用场景中要考虑的问题:
(3) 我们发现,与DNN相比,CNN架构的错误拒绝率( false reject rate)相对提高了27-44%,同时符合每个应用程序的约束条件。
(1) 引入KS,其应用场景,目前的难点:它不断地监听特定的关键字来启动语音输入。此关键字定位(KWS)系统运行在移动设备上,因此必须具有较小的内存占用和较低的计算能力。目前谷歌[2]的KWS系统使用深度神经网络(DNN),它被训练来预测子关键字目标。
(2) 说明DNN比起传统方法的优势:
(3) 说明CNN比起DNN的优势:而卷积神经网络(CNNs)[3]在过去几年已经在声学建模中流行,在各种小词汇任务[4,5,6]中比dnn有所改进(提升性能且减小模型尺寸)。
(4) 本文解决 parameters and multiplies问题的方式:
(5) 性能评估
(1) DNN KS [2]三个模块:
(1) 特征提取和后验处理阶段与第2节保持相同。
(2) CNNs结构介绍:
(3) 典型的卷积结构(两个卷积层):
为了参数数量在250k以内:
(4) 将乘法次数限制在500K以内,不限制参数数量:
在上述的基础上改变v值:
(5) 将参数数量限制在250K以内,不限制乘法次数:
1)
2) Striding in Time
3) Pooling in Time
总之就是Striding改变的是s,v, pooling改变的是p,q
(1) The lower the FR per FA rate is the better.
(2) Pooling in Frequency:比较了不同的q值,q=1到q=2性能增加不少,q=3性能饱和。比起DNN提升41%
(3) Limiting Multiplies:比较了不同的v值,
(4) Limiting Parameters
总结:
(1)限制乘法次数时:
(2)限制参数数量时:
文章版权归作者所有,未经允许请勿转载,若此文章存在违规行为,您可以联系管理员删除。
转载请注明本文地址:https://www.ucloud.cn/yun/119124.html
摘要:性能在谷歌语音命令数据集上准确率,且参数只有关键字定位是一项旨在检测音频流中预先训练好的单词的任务。其中一个应用就是唤醒词检测。事实上,捕获不同尺度的时间信息是很重要的,因为关键字的特征在时间尺度上通常是不同的。验证集测试集各。 目录 说明 Small-Footprint Keyword S...
摘要:自然语言处理研究方向文本分类与聚类文章标签和摘要提取文本审核与舆情分析机器翻译阅读理解聊天机器人搜索引擎等。应用文本基本任务预处理向量化分词词性标注文本结构化。 ...
摘要:所以接下来,我们需要简单的介绍下多线程中的并发通信模型。比如中,以及各种锁机制,均为了解决线程间公共状态的串行访问问题。 并发的学习门槛较高,相较单纯的罗列并发编程 API 的枯燥被动学习方式,本系列文章试图用一个简单的栗子,一步步结合并发编程的相关知识分析旧有实现的不足,再实现逻辑进行分析改进,试图展示例子背后的并发工具与实现原理。 本文是本系列的第一篇文章,提出了一个简单的业务场景...
摘要:到目前为止我们只实现了搜索功能,按更优的体验来讲,在搜索结果中,要优先把相连匹配的放在首位,如关键字,要把结果放到前面。 我们先看一下效果图:showImg(https://segmentfault.com/img/remote/1460000015486183?w=199&h=107); 这是搜索关键字cfg时,会自动匹配到config方法 同样,我们再看另一个例子 showImg(...
摘要:语法高亮插件语法高亮插件需要两个文件。语法检测当读取或创建时,将后缀的文件类型设置为,之后使用类型的语法高亮方案进行着色。语法高亮这是文本的重点,该文件告诉该怎么着色。 实习之后发现,一切代码活动都局限在一个终端界面了。由于一些安全原因和开发环境的方便,开发都是通过远程ssh到开发机上开发,自然也就只有终端界面了。VNC因为安全原因不让用,所以就别妄想使用Clion等IDE来开发了。在...
阅读 1134·2021-11-24 10:20
阅读 3496·2021-11-24 09:38
阅读 2135·2021-09-27 13:37
阅读 1974·2021-09-22 15:25
阅读 757·2021-09-04 16:45
阅读 2119·2021-09-01 18:33
阅读 3272·2019-08-30 15:55
阅读 1595·2019-08-30 15:54