4 月 22 日消息,小米技术今日宣布,开源视频消除技术 SVOR,该技术可以移除视频中出现的路人。

官方表示,现有的方法大多在理想条件下设计和验证,而真实世界的视频远比论文里的测试场景复杂 —— 模型识别的掩码边缘不够准、物体消除后阴影仍然留在画面里、目标快速移动时逐帧处理频繁“跟丢”导致闪烁。
class=”lazy” title=”移除视频中出现的路人,小米开源 CVPR 2026 夺冠技术 SVOR” data-original=”https://img.ithome.com/newsuploadfiles/2026/4/203fdae5-c62b-4357-b4ce-c3e45e3f392b.gif” width=”640″ height=”284″>
为此小米提出了 SVOR(Stable Video Object Removal)框架,专门针对上述三类“不完美条件”设计了对应的解决方案:用 MUSE 窗口化联合策略解决运动抖动,用 DA-Seg 去噪感知分割提升遮罩容错能力,并通过课程式两阶段训练让模型真正学会处理阴影和反射残留。

SVOR 在多个标准数据集和退化遮罩基准上均达到了新的 SOTA 水平,并在 CVPR 2026 物理感知视频实例消除挑战赛中从 18 支参赛队伍中脱颖而出,荣获第一名。
width=”1080″ height=”179″>
相关论文已经发布,项目代码也已开源,并准备好 skill 供直接调用,IT之家附相关链接如下:
-
论文:https://arxiv.org/abs/2603.09283
-
GitHub:https://github.com/xiaomi-research/svor
-
Skill:https://clawhub.ai/wangfei1204/mi-visionforge-svor
小米还表示,在视频消除的评测方案上也做了较多工作,包括评测数据收集整理和创新性评测方法,将在合适的时间进行开源。
