MediaPipe 新示例：灵活稳定的目标检测和追踪

谷歌开发者

于 2020-10-13 11:54:34 发布

阅读量4.8k

点赞数 1

文章标签：人工智能计算机视觉 python 深度学习大数据

本文链接：https://blog.csdn.net/googledevs/article/details/109063690

版权

MediaPipe推出了目标检测和追踪的新示例，结合运动分析、FlowPackager和BoxTracking计算器，实现跨帧维持目标ID的追踪。这种解决方案在保持轻量级和实时性的同时，通过减少每帧的检测次数，提高了目标位置的一致性和稳定性，适用于移动设备。MediaPipe的BoxTracking子计算图提供灵活和稳定的追踪能力，可以应用于多种场景，包括目标检测与追踪示例，展示出比逐帧检测更优的追踪效果。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

文 / MediaPipe 产品经理 Ming Guang Yong

MediaPipe 概览

MediaPipe (https://mediapipe.dev/) 可用于构建跨平台、多模态的 ML 流水线框架，由快速 ML 推理、传统计算机视觉和媒体处理（如视频解码）组成。2019 年 6 月，MediaPipe 在计算机视觉与模式识别大会 (CVPR) 上正式开放源代码，版本为 v0.5.0。自第一个开源版本以来，我们发布了各种 ML 流水线示例，如：

目标检测
https://google.github.io/mediapipe/solutions/object_detection
人脸检测
https://google.github.io/mediapipe/solutions/face_detection
手部追踪
https://google.github.io/mediapipe/solutions/hands
多个手部目标追踪
https://google.github.io/mediapipe/solutions/hands
头发分割
https://google.github.io/mediapipe/solutions/hair_segmentation

在本文中，我们将介绍一个 MediaPipe 新示例：目标检测和追踪。我们将先介绍检测框追踪解决方案 (Box Tracking)，然后解释如何将其与“目标检测”系统整合以提供目标检测和追踪。

目标检测和追踪
https://google.github.io/mediapipe/solutions/box_tracking

MediaPipe 检测框追踪

我们推出了一种检测框追踪解决方案，它利用了传统的计算机视觉方法，已为 Motion Stills、YouTube 隐私模糊处理和 Google 智能镜头提供数年的实时追踪支持。将追踪与 ML 推理配对，可以得到价值与效率兼具的流水线。在我们将检测框追踪与目标检测配对，创建了目标检测和追踪流水线。与每帧运行检测相比，拥有追踪功能的流水线具有多项优势：