鹏城实验室人工智能研究中心在国际顶级会议CVPR2019优秀论文分享(第二期)
时间:2019-06-11 点击:1924

在上期鹏城实验室人工智能研究中心CVPR2019论文录用30余篇的喜报中,我们分享了三篇优秀论文,本期我们将继续对另三篇文章进行分享。

代表论文摘要:

1. Scalable Convolutional Neural Network for Image Compressed Sensing【多尺度卷积神经网络在图像压缩感知中的应用】

本文由姜峰、刘绍辉和赵德斌老师团队主导完成。他们提出了一个多尺度的卷积神经网络(SCSNet),实现了只用一个模型进行图像的多尺度的采样和重构(图1所示)。具体来说,SCSNet可以同时提供粗粒度和细粒度的尺度缩放性能。对于粗粒度的尺度,SCSNet设计了一个采样矩阵、一个基层和多个增强层构成的多层级的重构网络。重构网络中的增强层通过参考前端的重构层,不断提升图像的重构精度。对于细粒度的尺度,SCSNet利用贪心算法选择测量基底,实现了任意的采样率下同时进行图像的采样和重构。和现有的基于压缩感知的深度学习算法相比,SCSNet只用了一个网络模型实现了任意采样率下的多尺度的采样和高精度图像重构。实验结果表面SCSNet达到了最先进的性能(图2所示),同时保证了运行效率和现有的基于压缩感知的深度学习算法相近。

1.网络结构示意图

图2.采用提出的算法回复的图像和其他算法结果的对比示例(SCSNet为本文提出的算法)


2. Weakly Supervised Image Classification through Noise Regularization【基于噪声归一化的弱监督图像分类】

本文由韩琥和山世光老师团队主导完成。他们提出了一种有效的弱监督学习的图像分类算法(图3所示)。在该算法中,数据库只有5%的样本属于正确标注,剩下的样本属于有噪声的标注,即样本标签不一定准确。他们提出的网络结构包含一个标签净化子网络和一个残差子网络。标签净化子网络可以将样本从一个特征空间映射到一个标签正确的空间;残差子网络可以将样本从一个特征空间映射到由正确标签和噪声标签构成的残差空间。在这种情况下,残差子网络相当于正则项的功能,可以提升标签净化子网络的训练精度。提出的算法在两个公开的多标签数据库(OpenImage and MS COCO2014)和一个单标签数据库(Clothing1M)进行了验证。一些示例的结果如图4所示。

图3.网络结构图

图4.多标签的图像分类示例


3. SIXray: A Large-scale Security Inspection X-ray Benchmark for Prohibited Item Discovery in Overlapping Images【大规模的物品混杂的X光图像数据库中的违禁物品监测】

本文由叶齐祥老师团队主导完成。他们提出了一个大规模的X光图像数据库(SIXray),这些图像中物品混杂,主要用于监测箱包中的违禁品。这个数据库SIXray共包含1,059,231个X光图像,数据库中有6大类的8,929个手工标注的违禁品。SIXray是一个全新的物品混杂的数据库,物品类别数量分布极其不均衡,同时还包含一些无意义的物品。他们提出了多层级的类平衡精炼网络(CHR,图5),用来处理数据库中类别分布不均衡的问题。CHR假设每幅图像都从一个混合分布中抽样,深度学习模型采用迭代的过程来准确的推理图像内容。为了加速,他们在不同的网络骨架中嵌入一些反向连接,用于将网络中高层的视觉特征反馈至中层。此外,他们设计了一个类平衡损失函数,用于缓解因为易分类的负样本(正样本属于违禁物品,负样本属于正常物品)所导致的噪声影响。通过评价不同的正负样本比例数,他们发现CHR的优势是利用中层特征在少量正样本情况下,具有更好的区分性能(图6所示)。

图5.网络结构图

图6. 违禁物品监察结果示例(Dense+CHR为本文提出算法)