2023-07-21:研究室参与的1篇细粒度图像检索论文被TPAMI接收
研究室参与的1篇细粒度图像分类论文被TPAMI接收,Xiu-Shen Wei, Yang Shen, Xuhao Sun, Peng Wang, Yuxin Peng*, "Attribute-Aware Deep Hashing with Self-Consistency for Large-Scale Fine-Grained Image Retrieval", IEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI), 2023。TPAMI是计算机视觉和人工智能领域顶级国际期刊,也是中国计算机学会(CCF)推荐的A类期刊,影响因子23.6。
大规模细粒度图像检索旨在根据查询中的细粒度描述,找出描绘感兴趣概念(即含有相同的子类别标签)的图像。该任务主要面临两方面的挑战:图像类间差异小、类内差异大,以及细粒度数据的爆炸性增长。针对上述问题,本文提出了一种属性感知的哈希网络,用于生成属性感知哈希码,在哈希码和视觉属性之间建立明确的对应关系,以实现高效的细粒度图像检索。首先,本文构建了一个编码器-解码器结构网络,用于从视觉表示中提取高层次的属性特定向量,并通过特征去相关约束增强模型的表征能力。然后,根据原始实体的相似性,从属性特定向量生成所需的哈希码,从而建模实体的属性。最后,为了克服深度哈希中的过拟合现象,本文从自洽性原则的角度考虑模型设计,通过增加图像重构路径来增强模型的自洽性,进一步增强模型的检索准确率。本文方法在六个细粒度检索数据集和两个通用检索数据集上进行了全面实验,实验结果显示了方法的有效性。
大规模细粒度图像检索旨在根据查询中的细粒度描述,找出描绘感兴趣概念(即含有相同的子类别标签)的图像。该任务主要面临两方面的挑战:图像类间差异小、类内差异大,以及细粒度数据的爆炸性增长。针对上述问题,本文提出了一种属性感知的哈希网络,用于生成属性感知哈希码,在哈希码和视觉属性之间建立明确的对应关系,以实现高效的细粒度图像检索。首先,本文构建了一个编码器-解码器结构网络,用于从视觉表示中提取高层次的属性特定向量,并通过特征去相关约束增强模型的表征能力。然后,根据原始实体的相似性,从属性特定向量生成所需的哈希码,从而建模实体的属性。最后,为了克服深度哈希中的过拟合现象,本文从自洽性原则的角度考虑模型设计,通过增加图像重构路径来增强模型的自洽性,进一步增强模型的检索准确率。本文方法在六个细粒度检索数据集和两个通用检索数据集上进行了全面实验,实验结果显示了方法的有效性。