本文主要是介绍Attribute Recognition简记1-Video-Based Pedestrian Attribute Recognition,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
创新点
1.行人属性库
2.行人属性识别的RNN框架及其池化策略
总结
先看看行人属性识别RNN结构:
backbone是ResNet50,输出是每一帧的空间特征。这组特征被送到两个分支,分别是空间池化和时间建模。最后两种特征拼接。然后分类(FC)。
LSTM关注帧间变化。受cvpr《Recurrent Convolutional Network for Video-Based Person Re-identification》启发,论文作者使用了max-pooling, mean-pooling用于空间和时间特征。
这篇关于Attribute Recognition简记1-Video-Based Pedestrian Attribute Recognition的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!