2020-08-24:祝贺何相腾同学荣获2020年北京大学优秀博士学位论文奖
王选计算机研究所彭宇新教授指导的2014级博士生何相腾的论文《辨识性特征学习及在细粒度分析中的应用》被评为2020年北京大学优秀博士学位论文。
本论文从减少标注成本、减少人工先验、提高辨识速度、提高语义关联四个方面展开辨识性特征学习研究,并分别应用于细粒度图像分类和细粒度跨媒体检索任务。在减少标注成本上,提出了基于对象-部件注意力模型的细粒度图像分类方法,仅使用图像级标注,不需要繁琐的对象级和部件级标注,大大降低应用成本。在减少人工先验上,提出了基于堆叠式深度强化学习的细粒度图像分类方法,避免了现有方法依赖人工先验所造成的可用性和可扩展性上的局限性。在提高辨识速度上,提出了基于弱监督快速辨识定位的细粒度图像分类方法,在提升分类准确率的同时,实现分类加速。在提高语义关联上,提出了基于细粒度分类的跨媒体检索方法,实现图像向跨媒体的扩展,分类向检索的扩展。建立了首个包含4种媒体类型(图像、文本、视频和音频)的细粒度跨媒体检索公开数据集和评测基准PKU FG-XMedia。
何相腾在博士期间,发表IEEE Trans.和CCF A类国际顶级论文10篇(一作9篇),包括IJCV、IEEE TIP、TCSVT、CVPR、ACM MM、IJCAI、AAAI,并接收CCF A类中文期刊1篇(一作)。2014年-2016年,连续3年作为团队成员,参加由美国国家标准技术局(NIST)举办的国际权威评测TRECVID的视频语义搜索比赛,均获第一名,参赛队伍包括IBM Watson研究中心、AT&T实验室、阿姆斯特丹大学、日本国立情报学研究所等国内外大学和研究机构。获得了北京市优秀毕业生、北京大学优秀毕业生、2018年百度奖学金、国家奖学金、校长奖学金、华为奖学金以及信息学院“学术十杰”等荣誉。
何相腾与导师彭宇新合影
本论文从减少标注成本、减少人工先验、提高辨识速度、提高语义关联四个方面展开辨识性特征学习研究,并分别应用于细粒度图像分类和细粒度跨媒体检索任务。在减少标注成本上,提出了基于对象-部件注意力模型的细粒度图像分类方法,仅使用图像级标注,不需要繁琐的对象级和部件级标注,大大降低应用成本。在减少人工先验上,提出了基于堆叠式深度强化学习的细粒度图像分类方法,避免了现有方法依赖人工先验所造成的可用性和可扩展性上的局限性。在提高辨识速度上,提出了基于弱监督快速辨识定位的细粒度图像分类方法,在提升分类准确率的同时,实现分类加速。在提高语义关联上,提出了基于细粒度分类的跨媒体检索方法,实现图像向跨媒体的扩展,分类向检索的扩展。建立了首个包含4种媒体类型(图像、文本、视频和音频)的细粒度跨媒体检索公开数据集和评测基准PKU FG-XMedia。
何相腾在博士期间,发表IEEE Trans.和CCF A类国际顶级论文10篇(一作9篇),包括IJCV、IEEE TIP、TCSVT、CVPR、ACM MM、IJCAI、AAAI,并接收CCF A类中文期刊1篇(一作)。2014年-2016年,连续3年作为团队成员,参加由美国国家标准技术局(NIST)举办的国际权威评测TRECVID的视频语义搜索比赛,均获第一名,参赛队伍包括IBM Watson研究中心、AT&T实验室、阿姆斯特丹大学、日本国立情报学研究所等国内外大学和研究机构。获得了北京市优秀毕业生、北京大学优秀毕业生、2018年百度奖学金、国家奖学金、校长奖学金、华为奖学金以及信息学院“学术十杰”等荣誉。
何相腾与导师彭宇新合影