原文标题:
论文阅读:Re3 : Real-Time Recurrent Regression Networks for Visual Tracking of Generic Objects
华盛顿大学的paper 发表于IEEE Robotics and Automation Letters 1705挂载arxiv上,在目标跟踪上,对待缩放形变遮挡等的效果还是很不错的。代码在https://gitlab.com/danielgordon10/re3-tensorflow上。
本文提出了一个实时,循环,基于回归的目标跟踪器。该跟踪器是通用物体的,并且十分鲁棒,其速度 为150fps,该方法是给定一个初始框,之后都跟踪这个初始框,和tracking by detection不是一个路子的。
现有的跟踪算法可以分为三类: online-trained 对新读入的每一张图都训练一个分类器 (DSST) offline-trained 离线训练,在线的时候也不更新 并不能接收新的讯息 hybrid 例如mdnet 本文提出的方法 训练虽然是离线的,但是有利用到前面帧的信息来做判断。
pipeline:
在上一帧相同的位置两倍长宽的地方crop bounding box 这里的两倍为经验值 然后将其resize 到227 然后输入到cnn中,然后把两个图片cnn的输出concatenate 起来再进入一个fc,再加一个fc是为了减少维度。 cnn里面还用了skip connections.
将cnn的输出作为lstm的输入,这里的lstm是一个两层的
之后将lstm的输出输入一个fc层,预测bbox的位置。
unrolling during training:
循环神经网络更难训练,这是由于输入的是时序。这里由于输入的是一对对的,所以 use a training curriculum that begins with few unrolls and slowly increase the time horizon that the network sees to teach it longer-term relationships.
作者:涂山容容
链接:https://www.jianshu.com/p/a0108df72615
共同学习,写下你的评论
评论加载中...
作者其他优质文章