北京大学多媒体信息处理研究室：新闻

[English Version]

关注MIPL微信公众号

招生方向

北京大学多媒体信息处理研究室：新闻

2025-08-22：MIPL师生参加 ChinaMM 2025

2025年8月22日至24日，中国多媒体大会（ChinaMM 2025）在山东省威海市召开。MIPL彭宇新教授、刘洋助理教授、博士生何胡凌霄、尹思博、赵国豪、郑翔天，硕士生王梓烁参加了此次会议。
ChinaMM每年举办一次，为多媒体领域的学术界和产业界提供前沿的技术发展动态、丰富多样的交流活动、全面前瞻的产业技术宣传平台，以广泛促进学术分享与交流、产业合作与互动，推动产学研联动发展，提升我国多媒体技术的研究与应用水平。
彭宇新教授作为讲习班主席，组织举办多模态大模型的理解和生成的讲习班，聚焦多模态语义对齐、跨模态生成、多模态内容理解、大模型轻量化等前沿方向，探讨大模型在视觉-语言理解、音视频生成、低空经济、硬件部署等领域的创新与应用，并展望多模态生成式智能技术的未来趋势与潜在突破。
彭宇新教授应邀参加期刊主编论坛，进行专题报告并开展圆桌讨论。本论坛系统梳理了多媒体领域的研究热点与发展方向，为学术界与产业界的协同创新提供了有益参考，与会者表示论坛内容可为相关领域的科研布局与期刊建设带来启发。

彭宇新教授应邀做《细粒度多模态大模型》专题报告

彭宇新教授应邀参加期刊主编论坛，进行专题讨论（左图从左到右：陈长汶、俞俊、徐常胜、彭宇新）

MIPL师生会场合影（从左到右：郑翔天、何胡凌霄、刘洋助理教授、彭宇新教授、王梓烁、尹思博、赵国豪）

本次大会MIPL论文被选中进行墙报展示，论文信息如下：
Yulong Lei, Zishuo Wang, Jinglin Xu* and Yuxin Peng, "Ctp2Fic: From Coarse-grained Token Pruning to Fine-grained Token Clustering for LVLM Inference Acceleration", China National Conference on Multimedia (ChinaMM), Weihai, Shandong, China, Aug. 22-24, 2025.
该论文针对多模态大模型因处理大量视觉令牌而导致推理效率低的问题，提出一种从粗粒度剪枝到细粒度聚类的两阶段压缩方法Ctp2Fic：通过文本令牌注意力引导的粗粒度剪枝，在浅层网络中初步滤除与任务无关的视觉令牌；然后利用基于局部敏感哈希的细粒度令牌聚类，在深层网络中合并语义相似的图像令牌，进一步降低视觉信息冗余，无需任何训练过程，提升模型的推理速度同时保持精度。

王梓烁同学墙报展示