2012-11-12:本研究室独立完成的1篇论文被多媒体领域权威国际期刊TMM接收
本研究室的1篇论文被IEEE Transactions on Multimedia(TMM)接收:Jian Yi, Yuxin Peng, and Jianguo Xiao, " Exploiting Semantic and Visual Context for Effective Video Annotation"。祝贺易剑同学。
该论文提出了一种基于语义上下文和视觉上下文的视频概念标注优化方法。一方面,分别利用星型结构和链式结构的条件随机场对视频中的空域语义上下文和时域语义上下文进行建模,和现有方法相比,能够更为准确地对概念之间的相互关系进行描述,由于利用了训练集中人工标注的语义信息,体现了人类对于视频内容和语义概念的理解,该方法能够有效提高概念标注的结果。另一方面,由于训练数据的局限性和问题本身的复杂性,基于语义上下文的优化方法还不能完美地对概念之间的关系进行建模,因此,利用视觉上下文对之进行有效补充,认为得分较高的镜头被进行了正确的标注,通过在视频镜头之间建立图结构,利用视觉上的相似性,采用半监督学习的方法用概念标注中置信度较高的优化结果对其余结果进行调整,能够进一步提高视频概念标注的准确率。
该论文提出了一种基于语义上下文和视觉上下文的视频概念标注优化方法。一方面,分别利用星型结构和链式结构的条件随机场对视频中的空域语义上下文和时域语义上下文进行建模,和现有方法相比,能够更为准确地对概念之间的相互关系进行描述,由于利用了训练集中人工标注的语义信息,体现了人类对于视频内容和语义概念的理解,该方法能够有效提高概念标注的结果。另一方面,由于训练数据的局限性和问题本身的复杂性,基于语义上下文的优化方法还不能完美地对概念之间的关系进行建模,因此,利用视觉上下文对之进行有效补充,认为得分较高的镜头被进行了正确的标注,通过在视频镜头之间建立图结构,利用视觉上的相似性,采用半监督学习的方法用概念标注中置信度较高的优化结果对其余结果进行调整,能够进一步提高视频概念标注的准确率。