为了账号安全,请及时绑定邮箱和手机立即绑定

论文阅读:Re3

标签:
机器学习

原文标题:

论文阅读:Re3 : Real-Time Recurrent Regression Networks for Visual Tracking of Generic Objects

华盛顿大学的paper 发表于IEEE Robotics and Automation Letters 1705挂载arxiv上,在目标跟踪上,对待缩放形变遮挡等的效果还是很不错的。代码在https://gitlab.com/danielgordon10/re3-tensorflow上。
本文提出了一个实时,循环,基于回归的目标跟踪器。该跟踪器是通用物体的,并且十分鲁棒,其速度 为150fps,该方法是给定一个初始框,之后都跟踪这个初始框,和tracking by detection不是一个路子的。
现有的跟踪算法可以分为三类: online-trained 对新读入的每一张图都训练一个分类器 (DSST) offline-trained  离线训练,在线的时候也不更新 并不能接收新的讯息 hybrid  例如mdnet  本文提出的方法 训练虽然是离线的,但是有利用到前面帧的信息来做判断。

pipeline:


webp


在上一帧相同的位置两倍长宽的地方crop bounding box  这里的两倍为经验值 然后将其resize 到227 然后输入到cnn中,然后把两个图片cnn的输出concatenate 起来再进入一个fc,再加一个fc是为了减少维度。 cnn里面还用了skip connections.

将cnn的输出作为lstm的输入,这里的lstm是一个两层的

之后将lstm的输出输入一个fc层,预测bbox的位置。

unrolling during training:
循环神经网络更难训练,这是由于输入的是时序。这里由于输入的是一对对的,所以 use a training curriculum that begins with few unrolls and slowly increase the time horizon that the network sees to teach it longer-term relationships.

             




作者:涂山容容
链接:https://www.jianshu.com/p/a0108df72615


点击查看更多内容
TA 点赞

若觉得本文不错,就分享一下吧!

评论

作者其他优质文章

正在加载中
  • 推荐
  • 评论
  • 收藏
  • 共同学习,写下你的评论
感谢您的支持,我会继续努力的~
扫码打赏,你说多少就多少
赞赏金额会直接到老师账户
支付方式
打开微信扫一扫,即可进行扫码打赏哦
今天注册有机会得

100积分直接送

付费专栏免费学

大额优惠券免费领

立即参与 放弃机会
意见反馈 帮助中心 APP下载
官方微信

举报

0/150
提交
取消