2023-10-16:研究室的1篇细粒度图像分类论文被TMM接收
研究室的1篇细粒度图像分类论文被TMM接收为Regular论文:Hongbo Sun, Xiangteng He and Yuxin Peng, "HCL: Hierarchical Consistency Learning for Webly Supervised Fine-Grained Recognition", IEEE Transactions on Multimedia (TMM), 2023。祝贺孙宏博同学!
细粒度图像分类旨在对粗粒度的大类进行细粒度的子类划分,具有重要的研究和应用价值,但细粒度数据对高质量专业人工标注的依赖限制了其推广和普及。因此,近期研究者们尝试通过引入网络图像数据作为免费的数据来源以缓解这一问题。然而,网络数据中通常含有噪声,降低了模型的细粒度图像分类准确率。针对上述问题,本文提出了层级语义一致性学习方法,模拟人类注意力逐渐聚焦关键区域的识别机制,利用正确标注样本在图像、对象、部件层级下语义预测保持一致的特性,实现噪声数据检测和细粒度信息提取。首先通过图像层级和对象层级的语义一致性计算检测开集噪声样本(与细粒度子类别完全无关的样本),然后通过对象层级和部件层级的语义一致性计算检测闭集噪声样本(误标注为其他子类别的样本),最终基于获取的干净样本进行多层级对比学习来增强细粒度表征,有效提升了细粒度图像分类准确率。本文方法在3个广泛使用的网络监督细粒度图像分类数据集上平均分类准确率达到90.1%,验证了本文方法的有效性。
细粒度图像分类旨在对粗粒度的大类进行细粒度的子类划分,具有重要的研究和应用价值,但细粒度数据对高质量专业人工标注的依赖限制了其推广和普及。因此,近期研究者们尝试通过引入网络图像数据作为免费的数据来源以缓解这一问题。然而,网络数据中通常含有噪声,降低了模型的细粒度图像分类准确率。针对上述问题,本文提出了层级语义一致性学习方法,模拟人类注意力逐渐聚焦关键区域的识别机制,利用正确标注样本在图像、对象、部件层级下语义预测保持一致的特性,实现噪声数据检测和细粒度信息提取。首先通过图像层级和对象层级的语义一致性计算检测开集噪声样本(与细粒度子类别完全无关的样本),然后通过对象层级和部件层级的语义一致性计算检测闭集噪声样本(误标注为其他子类别的样本),最终基于获取的干净样本进行多层级对比学习来增强细粒度表征,有效提升了细粒度图像分类准确率。本文方法在3个广泛使用的网络监督细粒度图像分类数据集上平均分类准确率达到90.1%,验证了本文方法的有效性。