2014-04-08:本研究室独立完成的2篇论文被人工智能领域顶级国际会议AAAI2014接收为Full Oral paper
本研究室的2篇论文被AAAI2014接收为Full Oral paper,其中一篇为Wenxuan Xie, Yuxin Peng, and Jianguo Xiao, "Cross-View Feature Learning for Scalable Social Image Analysis",另一篇为Wenxuan Xie, Yuxin Peng, and Jianguo Xiao, "Semantic Graph Construction for Weakly-Supervised Image Parsing"。祝贺谢文轩同学!
第一篇论文针对社交网站(例如Flickr)上的图像分析和识别问题,提出了基于社会化标签的跨模态特征学习算法。具体地,真实数据中图像数量和概念数量都较为庞大,因此为了得到较好的图像分析和识别性能,需要使用基于非监督设定的高效算法。本文提出的跨模态特征学习算法通过学习从文本特征空间到图像特征空间的映射,直接建模图像和文本的相关性得到优化后的特征表示。同时,本文方法相对于图像数量N的时间复杂度为O(N)。在两个数据集上的图像分类结果表明,本文所得到的优化后的特征表示能够取得比特征拼接方法以及现有的相关性分析(例如典型相关分析等)方法更好的效果。
第二篇论文针对弱监督图像解析问题提出了新的构图算法。具体来说,弱监督图像解析问题通过已知的图像类别标签来推断图像块的类别标签。现有方法主要是针对该弱监督学习问题进行建模。而本文研究表明,表示图像块之间相似度的图结构对于图像解析的准确率具有决定性的作用。现有的构图方法相对简单,主要是对数据集中的图像块构建L1图或KNN图;而本文在构图过程中提出了筛选相关图像块的准则,并提出了L1语义图和KNN语义图这两种新的构图算法。在标准数据集上的实验结果表明,本文提出的构图算法能够显著提高图像解析的准确率。
第一篇论文针对社交网站(例如Flickr)上的图像分析和识别问题,提出了基于社会化标签的跨模态特征学习算法。具体地,真实数据中图像数量和概念数量都较为庞大,因此为了得到较好的图像分析和识别性能,需要使用基于非监督设定的高效算法。本文提出的跨模态特征学习算法通过学习从文本特征空间到图像特征空间的映射,直接建模图像和文本的相关性得到优化后的特征表示。同时,本文方法相对于图像数量N的时间复杂度为O(N)。在两个数据集上的图像分类结果表明,本文所得到的优化后的特征表示能够取得比特征拼接方法以及现有的相关性分析(例如典型相关分析等)方法更好的效果。
第二篇论文针对弱监督图像解析问题提出了新的构图算法。具体来说,弱监督图像解析问题通过已知的图像类别标签来推断图像块的类别标签。现有方法主要是针对该弱监督学习问题进行建模。而本文研究表明,表示图像块之间相似度的图结构对于图像解析的准确率具有决定性的作用。现有的构图方法相对简单,主要是对数据集中的图像块构建L1图或KNN图;而本文在构图过程中提出了筛选相关图像块的准则,并提出了L1语义图和KNN语义图这两种新的构图算法。在标准数据集上的实验结果表明,本文提出的构图算法能够显著提高图像解析的准确率。