张纯

UCloud流媒体研发部经理

后供职于腾讯和UCloud。现主要负责UCloud流媒体相关产品的后台研发,专注于音视频传输与处理优化与运营。拥有近10年的互联网研发经验,对流媒体协议、传输优化、视频编解码等方面有丰富的理论和实践经验。

本次分享主要介绍计算机视觉、听觉在流媒体领域的一些应用。在分享中,会介绍UCloud基于已有的媒体对象存储、媒体工厂、云直播等大数据平台,使用深度神经网络等模型,对海量的媒体数据进行特征提取与学习,并且应用到涉黄爆恐识别、媒体内容审核、视频自动标签、同声传译、等业务平台的一些技术与经验。

专业文章 01
《浅谈人工智能在流媒体领域的应用》

人工智能正加速改变各个行业,而流媒体领域可能是其中改变最快的一个。随着神经网络相关算法问题得到解决,人工智能技术在最近几年得到了快速的发展,而人工智能技术在流媒体领域的渗透,使这项技术获得了新的突破。当下图片、长视频、短视频、直播、AR等各种媒体形式占据着互联网圈,在媒体内容和形式都非常丰富的今天,如何辨识、解析这些内容,并通过人工智能反馈是目前所有科技巨头关注的焦点,其中图像识别、语音语义识别、同声传译、字幕识别等应用场景的进一步挖掘,需要人工智能大战拳脚。

专业文章 02
《浅谈深度学习的技术原理及其在计算机视觉的应用》

什么是计算机视觉呢?形象地说,计算机视觉就是给计算机装上眼睛(照相机)和大脑(算法),让计算机可以感知周围的环境。目前计算机视觉研究主要集中在基础应用场景,像图片分类、物体识别、人脸的3D建模等。

精彩正在继续 欢迎您的加入