• Jump to Content
北京大学计算机研究所多媒体信息处理研究室
[English Version]

关注MIPL微信公众号

主页
新闻
成员
招生方向
研究方向 招生要求 毕业生简介
科研项目
主要论文
成果应用
开设课程
国际评测
发明专利
学生荣誉
活动休闲

class

GIF PlaceHolder
  1. 研发的虚拟换衣技术应用于快手可图虚拟换衣业务,能够根据用户提供的人物图和所选择的商品图,生成整体效果自然、细粒度元素高度保真的换衣效果图
  2. 研发的动态试穿视频生成技术应用于淘宝短视频广告投放,可根据静态商品图和描述文本自动生成动态视频,并能够精确控制视频中的商品细节和人物动作
  3. 研发的广告海报生成模型应用于腾讯广告投放,根据用户提供的商品图和文本描述生成商品宣传海报,能够准确生成文字细节、形状样式等细粒度视觉元素
  4. 研发的美学摄影创作技术应用于华为手机图库APP,具备①摄影指导、②照片裁剪、③样片生成三大功能,帮助非专业用户创作出媲美专业水准的照片


  5. 研发的端侧通用视觉模型应用于华为手机图库APP,大幅降低模型参数量,并保持模型精度,提升在智能手机等端侧设备上的部署效率
  6. 研发的大模型强化学习训推共卡(同一批GPU同时承担模型训练与推理)加速技术应用于华为诺亚盘古大模型,通过细粒度的数据调度与采样降低了GPU空闲,减少了多步的训练用时,降低了训练和推理成本
  7. 研发的端侧障碍物感知模型应用于中国航天科工三院无人机控制系统,部署在端侧无人机设备,实现自主避障、自主降落,为无人机低空飞行提供安全保障
  8. 研发的多模态感知大模型应用于蔚来汽车自动驾驶业务,实现了行人、车辆等运动目标的速度预测和检测追踪功能,取得厘米级精度的速度预测效果,降低人工标注成本,缩短模型更新周期,大大提高蔚来自动驾驶产品竞争力
  9. 研发的多场景通用多模态模型应用于中国铁塔视联平台,涵盖50种以上细粒度类别对象、4种模态监控场景,支持5种以上下游任务,相比铁塔原有模型精度和效率大幅提升


北京大学王选计算机研究所多媒体信息处理研究室