2015-03-03:研究室的1篇论文被计算机视觉与模式识别领域的顶级国际会议CVPR 2015接收
研究室的1篇论文被CVPR 2015接收:Tianjun Xiao, Yichong Xu, Kuiyuan Yang, Jiaxing Zhang, Yuxin Peng, and Zheng Zhang, "The Application of Two-level Attention Models in Deep Convolutional Neural Network for Fine-grained Image Classification", IEEE International Conference on Computer Vision and Pattern Recognition (CVPR), Boston, MA, USA, June 7-12, 2015,祝贺硕士生肖天骏同学!
细粒度图像分类问题具有类间差距小而类内变化大的特点,是计算机视觉中的一个困难问题。深度学习由于其较强的特征学习能力在该任务下取得了较好的效果,但传统深度学习方法对类间细微差异以及类内姿态变化的建模效果依然不够理想。针对这一问题,本论文从仿生学出发,模仿人类视觉具有注意力,从而能够定位、缩放关键区域的功能,提出了物体级别的视觉注意力以及局部级别的视觉注意力建模方法,前者使用包含类别信息的图像分块训练深度网络以学到更多的细节特征,后者定位到特定的物体局部以缓解姿态不同带来的干扰。两种模型与传统深度学习方法相比均有较大提升,两者融合也取得了更高的准确率。此外,相比于现有方法,该方法的训练无需物体边界、位置等额外标注信息,可以节约大量的人工标注成本,适合扩展到大规模数据集的图像分类应用。
细粒度图像分类问题具有类间差距小而类内变化大的特点,是计算机视觉中的一个困难问题。深度学习由于其较强的特征学习能力在该任务下取得了较好的效果,但传统深度学习方法对类间细微差异以及类内姿态变化的建模效果依然不够理想。针对这一问题,本论文从仿生学出发,模仿人类视觉具有注意力,从而能够定位、缩放关键区域的功能,提出了物体级别的视觉注意力以及局部级别的视觉注意力建模方法,前者使用包含类别信息的图像分块训练深度网络以学到更多的细节特征,后者定位到特定的物体局部以缓解姿态不同带来的干扰。两种模型与传统深度学习方法相比均有较大提升,两者融合也取得了更高的准确率。此外,相比于现有方法,该方法的训练无需物体边界、位置等额外标注信息,可以节约大量的人工标注成本,适合扩展到大规模数据集的图像分类应用。