张纯 - UCloud中立云计算服务商

张纯

UCloud流媒体研发部经理

先后供职于腾讯和UCloud。现主要负责UCloud流媒体相关产品的后台研发，专注于音视频传输与处理优化与运营。拥有近10年的互联网研发经验，对流媒体协议、传输优化、视频编解码等方面有丰富的理论和实践经验。

本次分享主要介绍计算机视觉、听觉在流媒体领域的一些应用。在分享中，会介绍UCloud基于已有的媒体对象存储、媒体工厂、云直播等大数据平台，使用深度神经网络等模型，对海量的媒体数据进行特征提取与学习，并且应用到涉黄爆恐识别、媒体内容审核、视频自动标签、同声传译、等业务平台的一些技术与经验。

专业文章 01

《浅谈人工智能在流媒体领域的应用》

人工智能正加速改变各个行业，而流媒体领域可能是其中改变最快的一个。随着神经网络相关算法问题得到解决，人工智能技术在最近几年得到了快速的发展，而人工智能技术在流媒体领域的渗透，使这项技术获得了新的突破。当下图片、长视频、短视频、直播、AR等各种媒体形式占据着互联网圈，在媒体内容和形式都非常丰富的今天，如何辨识、解析这些内容，并通过人工智能反馈是目前所有科技巨头关注的焦点，其中图像识别、语音语义识别、同声传译、字幕识别等应用场景的进一步挖掘，需要人工智能大战拳脚。

专业文章 02

《浅谈深度学习的技术原理及其在计算机视觉的应用》

什么是计算机视觉呢？形象地说，计算机视觉就是给计算机装上眼睛（照相机）和大脑（算法），让计算机可以感知周围的环境。目前计算机视觉研究主要集中在基础应用场景，像图片分类、物体识别、人脸的3D建模等。

精彩正在继续欢迎您的加入

UCloud与云服务

快速入口

常见问题

用户俱乐部