北京大学王选计算机研究所多媒体信息处理研究室

Document Title

主页

新闻

2016-04-05：本研究室独立完成的1篇论文被人工智能领域顶级国际会议IJCAI 2016录用为长文

　　本研究室的1篇论文Yuxin Peng, Xin Huang, and Jinwei Qi, "Cross-media Shared Representation by Hierarchical Learning with Multiple Deep Networks"被IJCAI 2016录用为长文。IJCAI是人工智能领域顶级国际会议，也是CCF推荐的A类会议，本次共有2294 篇论文提交，接收率低于25%。祝贺黄鑫同学，綦金玮同学！
　　针对跨媒体统一表示学习中如何有效建模媒体内部和媒体之间关联关系的问题，提出了一种基于多深度网络结构的跨媒体统一表示学习方法。该方法分为两步：单媒体表示学习和跨媒体统一表示学习。在单媒体表示学习中，使用栈式自编码器通过最小化重构误差来得到单媒体语义表示，同时使用多模态深度信念网络对多种媒体数据的关联建模得到单媒体关联表示。在跨媒体统一表示学习中，构建两级深度网络结构，先将上述的同种媒体的单媒体语义表示、单媒体关联表示进行融合，再使用多模态自编码器同时建模跨媒体数据的重构误差及关联关系，从而得到不同媒体的统一表示。通过构建层次化的深度网络结构，实现了对媒体内部与媒体之间关联关系的共同建模与有效融合，使得学习到的跨媒体统一表示具有更强的表达能力，提高了检索准确率。该方法在3个广泛使用的跨媒体数据集上验证了有效性，包括Wikipedia数据集，NUS-WIDE-10k数据集和Pascal Sentence数据集。

论文下载: Cross-media Shared Representation by Hierarchical Learning with Multiple Deep Networks【pdf】