2015-09-14:研究室独立完成的2篇论文被多媒体领域国际会议MMM 2016接收
本研究室的2篇论文被MMM2016接收,其中一篇为Lei Huang and Yuxin Peng, “Cross-Media Retrieval via Semantic Entity Projection”,另一篇为Panpan Tang and Yuxin Peng, “Logo Recognition via Improved Topological Constraint”。祝贺黄雷同学,唐攀攀同学!
第一篇论文考虑到大多数跨媒体检索方法都是将不同模态的特征映射到统一特征子空间上,然后把统一特征子空间作为底层特征到高层特征的统一表示层。这种表示往往没有明确的语义,因此忽略了原始特征空间的语义内容。针对上述问题,提出了基于语义实体映射的跨媒体检索方法,首先构建具有细粒度语义的实体层,再通过实体映射将不同媒体底层特征映射到具有明确语义的实体层,最后通过逻辑回归得到高层语义概念的概率表示。这种具有细粒度语义的实体层在一定程度上缓解了高层语义概念的歧义问题,能够帮助跨媒体的语义映射学习。该方法的有效性在图像-文本数据集Wikipedia上得到了验证。
第二篇论文考虑到基于关键点匹配的Logo(标志)识别算法中的误匹配问题和关键点过多问题,提出了一种拓扑约束与特征选择相结合的Logo识别算法。首先,利用特征选择算法过滤掉大部分与目标Logo不相关的特征点,一方面能够减少这些不相关点对识别带来的干扰,另一方面为后续识别减少了计算量;然后,基于选择后的特征点进行匹配,得到候选匹配点对;最后,利用提出的空间拓扑约束来消除误匹配,得到最终的匹配点对。该方法的有效性在两个公开的Logo识别数据集FlickrLogos32和FlickrLogos27上得到了验证。
第一篇论文考虑到大多数跨媒体检索方法都是将不同模态的特征映射到统一特征子空间上,然后把统一特征子空间作为底层特征到高层特征的统一表示层。这种表示往往没有明确的语义,因此忽略了原始特征空间的语义内容。针对上述问题,提出了基于语义实体映射的跨媒体检索方法,首先构建具有细粒度语义的实体层,再通过实体映射将不同媒体底层特征映射到具有明确语义的实体层,最后通过逻辑回归得到高层语义概念的概率表示。这种具有细粒度语义的实体层在一定程度上缓解了高层语义概念的歧义问题,能够帮助跨媒体的语义映射学习。该方法的有效性在图像-文本数据集Wikipedia上得到了验证。
第二篇论文考虑到基于关键点匹配的Logo(标志)识别算法中的误匹配问题和关键点过多问题,提出了一种拓扑约束与特征选择相结合的Logo识别算法。首先,利用特征选择算法过滤掉大部分与目标Logo不相关的特征点,一方面能够减少这些不相关点对识别带来的干扰,另一方面为后续识别减少了计算量;然后,基于选择后的特征点进行匹配,得到候选匹配点对;最后,利用提出的空间拓扑约束来消除误匹配,得到最终的匹配点对。该方法的有效性在两个公开的Logo识别数据集FlickrLogos32和FlickrLogos27上得到了验证。