鹏城实验室举办“创新沙龙”——OpenI海参(深度学习视频编码)码拉松活动
时间:2019-10-31 点击:1050

2019年10月30日,OpenI海参(深度学习视频编码)视频编码码拉松于鹏城实验室成功举办,活动主题围绕视频智能编码技术框架的创新应用展开,OpenI海参项目(Deep Learning-Based Video Coding)源自H.266标准联合征集提案中的一部分,现在成为OpenI启智平台社区核心开源项目,旨在超越HEVC标准的压缩性能,为下一代标准提供技术积累。

OpenI启智平台开源项目工作组张俊主持活动,并邀请嘉宾北京大学法学院张平教授、中国科学技术大学副教授刘东老师分别针对视频编解码专利及许可政策分析、深度学习视频编码技术概论做了精彩的演讲分享。OpenI启智平台秘书长刘明博士到场参加了全程活动。

活动嘉宾及参赛选手合影

活动开始,鹏城实验室DLVC(深度学习视频编码)工作组张志聪对OpenI海参项目进行介绍,从网络构架、训练策略、编码效果等方面详细解析OpenI海参项目的技术特点。

深度学习用于图像视频压缩编码已经明显优于传统方法,中国科学技术大学副教授刘东老师从什么是深度学习、为什么要用深度学习算法、如何将深度学习算法用于视频编码等三个方面进行了深入浅出的讲解,并与传统的小波变换等方法做了对比。OpenI海参基于目前的技术积累已是业界领先的DLVC开源验证平台,兼容Caffe、TensorFlow、PyTorch三大深度学习框架,拥有重建后滤波、变分辨率两项技术。最后,刘东老师对视频编码的未来进行了理性客观的展望,要进一步发挥视频智能编码的潜力可以从以下三个方面入手:第一进一步挖掘视频中的时间相关性;第二面向视觉的质量优化;第三与图像视频分析、计算机视觉任务结合。刘东老师表示,目前视频智能编码仍面临一些困难,首先是设计完善的端到端方案或多个模块联合优化,其次是网络结构设计,最后在压缩效率和复杂度之间折中的办法。刘东老师的精彩分享助力OpenI海参开源项目全方位的推广和社区生态建设。

随后,北京大学法学院张平教授以卷积神经网络技术在全球及中国专利布局分析为基础,对视频编解码专利及许可政策进行了非常详细且丰富的介绍。张平教授以专利热力图展示了人工智能领域的专利布局,分别从企业持有的专利、专利的申请时间和专利深度三个维度分析了现有人工智能领域中专利的现状。随后针对视频编解码技术中的MPEG-4、AVC、HEVC三个标准中的专利及许可政策进行介绍,并对编解码技术领域中现有的情况做了详细的剖析和解读。

张平教授在此次的讲座中以真实案例为我们说明了专利分析的重要性,其体现不仅仅是法律维权的层面上,而是从掌握技术未来的趋势和发展的动态入手,做好完善的专利分析,不仅能降低研发成本,还能抢占先机。有句古话说,唯有知己知彼,方能百战百胜,在日新月异的技术领域中也不例外。

图片-2.jpg

北京大学法学院张平教授

下午来自中国科学技术大学、北京大学、哈尔滨工业大学、武汉大学的七支参赛队伍代表针对各自参赛作品的算法及训练策略进行参赛方案的展示,详细解读深度学习与视频编码技术的有机结合。

1、中国科学技术大学USTC_CodingMan团队的霍帅  2、中科大 USTCCoder 杨闰宇 3、哈工大 HIT编码小队 郑博    

  4、中科大 USTC_FVCoder 董存辉       5、武汉大学 WHAT(原小肥羊队)刘子政       6、北京大学 PKUVCL  赵磊

编码技术是一切数字音视频系统的基石,在过去的五十年里已经有一系列的编码技术、标准被发明及应用,而目前国际上还有多种标准与技术正在研发中。OpenI技术委员会下属的“海参”项目技术委员会,将对此次码拉松各队的代码和解决方案进行测评,评选出优胜队,进行专家点评和颁奖。其中,富有创意的解决方案及代码将在OpenI启智的官网上进行展示和进一步的改进研讨。

参赛队伍发言代表合影


OpenI启智官网:https://www.openi.org.cn/

撰稿:人工智能研究中心 张海若

摄影:张海若