2014-11-09:本研究室独立完成的2篇论文被人工智能领域顶级国际会议AAAI2015录用为长文
第1篇是Chao Zhu and Yuxin Peng, "A Boosted Multi-Task Model for Pedestrian Detection with Occlusion Handling", 第2篇是Yuxin Peng, "Adaptive Sampling with Optimal Cost for Class-Imbalance Learning",AAAI是人工智能领域的顶级国际会议,2014年共有1991篇论文提交,接收率为26.67%。祝贺朱超博士后!
第1篇论文针对行人检测中的遮挡问题提出了一种新的遮挡处理模型。现有主流检测方法普遍面临着一个问题,就是随着遮挡程度的增加其检测性能会明显下降。目前常用的遮挡处理方法主要是分别训练一组针对不同遮挡程度的检测器,然后将结果进行融合,其不足是这些检测器都是独立训练的,它们之间的关联关系被忽略掉了。在本文中,我们把在不同遮挡程度下的行人检测看作一系列不同但互相关联的任务,提出了一种增强的多任务模型来同时考虑他们的区别与联系。具体地,我们首先采用多任务学习算法将不同遮挡程度下的行人样本映射到一个共同子空间中,使得在这个子空间中的不同遮挡模型都共享同一组有效样本特征,然后在此子空间中基于共享样本特征训练一个增强的级联检测器来对不同遮挡程度下的行人进行检测。实验结果表明,本文提出的方法能够有效提高在不同遮挡情况下的检测准确率。
第2篇论文针对样本不平衡学习问题提出了一种自适应采样且代价最优的不平衡学习算法。现有的不平衡学习方法一般分为数据层方法和算法层方法两大类:数据层方法通常需要预先设定数据重采样的比例,这很难做出优化的选择,而这对分类性能影响极大。此外现有方法在对负样本的欠采样(under-sampling)中经常会丢弃很多有用的负样本;算法层方法主要是优化学习代价,但其效果受限于仅仅使用了不平衡的原始训练数据集。针对上述问题,本文结合了数据层方法和算法层方法的优点,提出了一种自适应采样且代价最优的不平衡学习算法。首先自适应地对少数正样本进行过采样(over-sampling),同时对多数负样本进行欠采样,这样能够充分利用所有训练样本来构成不同的训练子集;然后针对不同的训练子集自动选择最优代价训练出各个子分类器;最终组合这些子分类器来获得一个强分类器。实验结果表明,本文提出的方法在多个标准数据集上取得了比现有方法更好的分类效果。
第1篇论文针对行人检测中的遮挡问题提出了一种新的遮挡处理模型。现有主流检测方法普遍面临着一个问题,就是随着遮挡程度的增加其检测性能会明显下降。目前常用的遮挡处理方法主要是分别训练一组针对不同遮挡程度的检测器,然后将结果进行融合,其不足是这些检测器都是独立训练的,它们之间的关联关系被忽略掉了。在本文中,我们把在不同遮挡程度下的行人检测看作一系列不同但互相关联的任务,提出了一种增强的多任务模型来同时考虑他们的区别与联系。具体地,我们首先采用多任务学习算法将不同遮挡程度下的行人样本映射到一个共同子空间中,使得在这个子空间中的不同遮挡模型都共享同一组有效样本特征,然后在此子空间中基于共享样本特征训练一个增强的级联检测器来对不同遮挡程度下的行人进行检测。实验结果表明,本文提出的方法能够有效提高在不同遮挡情况下的检测准确率。
第2篇论文针对样本不平衡学习问题提出了一种自适应采样且代价最优的不平衡学习算法。现有的不平衡学习方法一般分为数据层方法和算法层方法两大类:数据层方法通常需要预先设定数据重采样的比例,这很难做出优化的选择,而这对分类性能影响极大。此外现有方法在对负样本的欠采样(under-sampling)中经常会丢弃很多有用的负样本;算法层方法主要是优化学习代价,但其效果受限于仅仅使用了不平衡的原始训练数据集。针对上述问题,本文结合了数据层方法和算法层方法的优点,提出了一种自适应采样且代价最优的不平衡学习算法。首先自适应地对少数正样本进行过采样(over-sampling),同时对多数负样本进行欠采样,这样能够充分利用所有训练样本来构成不同的训练子集;然后针对不同的训练子集自动选择最优代价训练出各个子分类器;最终组合这些子分类器来获得一个强分类器。实验结果表明,本文提出的方法在多个标准数据集上取得了比现有方法更好的分类效果。