• Jump to Content
北京大学计算机研究所多媒体信息处理研究室
[中文版] [English Version]
Document Title
主页
新闻
成员
招生方向
研究方向
主要论文
科研项目
国际评测
相关报道
发明专利
开设课程
学生荣誉
学术交流
活动休闲
2025-05-11:MIPL师生参加 CCIG 2025

  2025年5月8日至11日,中国图象图形大会(Chinese Congress on Image and Graphics, CCIG 2025)在湖南省长沙市召开。MIPL彭宇新教授、研究生王梓烁、何胡凌霄、尹思博、赵国豪、郑翔天、崔逸翔参加了此次会议。
  CCIG每年举办一次,是中国图象图形学学会的年度旗舰会议,涵盖图像图形各专业领域的学术盛会。本次会议吸引了4000余名科研院校师生、一线技术工程师前来参会。会议包括学术论坛、主题报告和墙报展示等环节。
彭宇新教授主持颁奖典礼
MIPL师生会场合影(从左自右:赵国豪、何胡凌霄、尹思博、彭宇新教授、王梓烁、崔逸翔、郑翔天)
  本次大会MIPL共有两篇论文被选中进行墙报展示,论文信息如下:
  [1] Hulingxiao He, Geng Li, Zijun Geng, Jinglin Xu and Yuxin Peng*, "Analyzing and Boosting the Power of Fine-Grained Visual Recognition for Multi-modal Large Language Models", The Thirteenth International Conference on Learning Representations (ICLR), Singapore, Apr. 24-28, 2025.【相关论文信息】
  该论文针对多模态大模型识别粒度粗的问题,提出细粒度知识对比增强方法:通过细粒度属性知识构建,获得大语言模型中的细粒度子类别知识;再利用属性知识增强的对比学习,对齐子类别知识与多模态数据;最后进行识别为中心的指令微调,以提升细粒度多模态大模型的识别准确率。
何胡凌霄同学做墙报展示

  [2] Jinglin Xu, Sibo Yin and Yuxin Peng*, "Human-centric Fine-grained Action Quality Assessment", IEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI), 2025. 【相关论文信息】
  本文提出了一种新的以人为中心的统一细粒度动作时空解析方法Uni-FineParser:首先设计空间动作解析器(SAP),引导模型解析人体运动区域,排除无关信息干扰;其次提出时间动作解析器(TAP),利用Transformer Decoder解析动作过程,划分不同动作步骤;然后提出静态视觉编码器(SVE),补充每一视频帧的静态上下文信息;最后通过不同动作步骤间的对比回归量化示例动作和目标动作间的误差,实现细粒度动作质量评价。
尹思博同学做墙报展示
北京大学王选计算机研究所多媒体信息处理研究室