MediaPipe 新示例:灵活稳定的目标检测和追踪

MediaPipe推出了目标检测和追踪的新示例,结合运动分析、FlowPackager和BoxTracking计算器,实现跨帧维持目标ID的追踪。这种解决方案在保持轻量级和实时性的同时,通过减少每帧的检测次数,提高了目标位置的一致性和稳定性,适用于移动设备。MediaPipe的BoxTracking子计算图提供灵活和稳定的追踪能力,可以应用于多种场景,包括目标检测与追踪示例,展示出比逐帧检测更优的追踪效果。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

文 / MediaPipe 产品经理 Ming Guang Yong

MediaPipe 概览

MediaPipe (https://mediapipe.dev/) 可用于构建跨平台、多模态的 ML 流水线框架,由快速 ML 推理、传统计算机视觉和媒体处理(如视频解码)组成。2019 年 6 月,MediaPipe 在计算机视觉与模式识别大会 (CVPR) 上正式开放源代码,版本为 v0.5.0。自第一个开源版本以来,我们发布了各种 ML 流水线示例,如:

  • 目标检测
    https://google.github.io/mediapipe/solutions/object_detection

  • 人脸检测
    https://google.github.io/mediapipe/solutions/face_detection

  • 手部追踪
    https://google.github.io/mediapipe/solutions/hands

  • 多个手部目标追踪
    https://google.github.io/mediapipe/solutions/hands

  • 头发分割
    https://google.github.io/mediapipe/solutions/hair_segmentation

在本文中,我们将介绍一个 MediaPipe 新示例:目标检测和追踪。我们将先介绍检测框追踪解决方案 (Box Tracking),然后解释如何将其与“目标检测”系统整合以提供目标检测和追踪。

  • 目标检测和追踪
    https://google.github.io/mediapipe/solutions/box_tracking

MediaPipe 检测框追踪

我们推出了一种检测框追踪解决方案,它利用了传统的计算机视觉方法,已为 Motion Stills、YouTube 隐私模糊处理和 Google 智能镜头提供数年的实时追踪支持。将追踪与 ML 推理配对,可以得到价值与效率兼具的流水线。在我们将检测框追踪与目标检测配对,创建了目标检测和追踪流水线。与每帧运行检测相比,拥有追踪功能的流水线具有多项优势:

  1. 提供基于实例的追踪,即跨帧维持目标 ID。

  2. 无需每帧运行检测。这些优点让我们可以运行负载更高但更为精确的检测模型,同时在移动设备上保持流水线的轻量级和实时性。

  3. 有了追踪功能,目标的位

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值