Deeply Learned Attributes for Crowded Scene Understanding（WWW dataset）

最新推荐文章于 2024-11-03 17:25:58 发布

天涯苏打

最新推荐文章于 2024-11-03 17:25:58 发布

阅读量596

点赞数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/yuanyuan_csdn_/article/details/76302148

版权

Deeply Learned Attributes for Crowded Scene Understanding

主要内容：

1. 自己创建数据集：Who do What at someWhere (WWW)

2. 用深度模型训练

动机：大多数的人群研究都是基于特定场景的，变化场景表现就没有那么好了

不同场景都有着相同的属性，但是这些属性没有明确的定义

创建数据集用于理解人群的场景

具体工作：

创建数据集WWW：

1. 数据集内容：

10,000 videos

8257 crowded scenes

94 attributes

The largest dataset , all from real-word

2. 创建步骤：

1）从人群场景中收集关键词

2）收集视频，从Getty Images, Pond, andYouTube，surveillance，movies

3）收集属性：we first collected tagsfrom Pond5 and Getty Images，再做一些处理（属性的清理工作），并雇佣一些人为视频标记这些属性

用卷积神经网络

1）输入：以往的模型是直接输入帧

我们的模型：appearance and crowd motion channels ,可以这样做的原因：differentcrowd system share similar principles that can be characterized by some genericproperties.

（让我们的模型去学习外表和运动特征，并结合他们，可以抓取属性之间的相关性）

用以下的卷积神经网络模型：

2）提取motion channels

Three motion channels :Collectiveness ,Stability ,Conflict

All the descriptors are defined upon tracklets detected by the KLT feature point tracker, and each of them is computed on 75 frames of each video in the WWW dataset.
We first define a K-NN (K = 10) graph for the whole tracklet point set.
We use descriptor in [45] to extract collectiveness. [33] to stability. [33] to conflict.

实验：

1. 人工实验

找来8个实验者，在分别给定background10, tracklets, and background with tracklets下测试人工分辨的如何

2. 用深度模型在www数据集上训练

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。