2019-01-08:研究室一篇多媒体内容理解综述论文在《计算机研究与发展》60周年特刊发表
为了纪念《计算机研究与发展》创刊60周年,彭宇新教授受《计算机研究与发展》编委会邀请,在2019年1月出版的60周年特刊上发表综述论文:彭宇新,綦金玮,黄鑫,“多媒体内容理解的研究现状与展望”,56 (1): 183-208,2019。
随着多媒体和网络技术的迅猛发展,海量的图像、视频、文本、音频等多媒体数据快速涌现。这些不同媒体的数据在形式上多源异构,语义上相互关联。如何对不同媒体的数据进行语义分析和关联建模以实现多媒体内容理解,成为了一个研究和应用的关键问题。本文选取了多媒体内容理解的5个最新热点研究方向:图像细分类与检索、视频分类与目标检测、跨媒体检索、视觉描述与生成、视觉问答,分别阐述了它们的基本概念、代表性方法、研究现状等,并进一步阐述了多媒体内容理解面临的重要挑战,同时给出未来的发展趋势,旨在推动该领域研究的进一步发展。
论文下载: 多媒体内容理解的研究现状与展望【pdf】
随着多媒体和网络技术的迅猛发展,海量的图像、视频、文本、音频等多媒体数据快速涌现。这些不同媒体的数据在形式上多源异构,语义上相互关联。如何对不同媒体的数据进行语义分析和关联建模以实现多媒体内容理解,成为了一个研究和应用的关键问题。本文选取了多媒体内容理解的5个最新热点研究方向:图像细分类与检索、视频分类与目标检测、跨媒体检索、视觉描述与生成、视觉问答,分别阐述了它们的基本概念、代表性方法、研究现状等,并进一步阐述了多媒体内容理解面临的重要挑战,同时给出未来的发展趋势,旨在推动该领域研究的进一步发展。