AAAI2020丨利用注意力机制,实现最优相机定位 大讲堂 | 第152期
深度学习在视觉定位方面取得了令人印象深刻的结果
开课时间:2020/02/06 18:00 预计时长:15分钟左右
课程回放
270人报名
观看回放
课程介绍

  讲者介绍  

 

王冰,牛津大学计算机系2018级博士,研究方向为Robotics & Computer Vision

 

  论文主题  

AtLoc: Attention Guided Camera Localization

 

  论文内容简介  

深度学习在视觉定位方面取得了令人印象深刻的结果。然而基于图像的定位方法普遍缺乏鲁棒性,从而导致较大误差。当前算法多通过图像序列或添加几何约束方法,迫使网络在学习时拒绝动态目标和光照变化对定位的干扰,以获得更好的性能。

本文提出了一种利用注意力机制使网络自动关注并提取具有几何意义的对象和特征,即使仅基于单张图像,也可以实现优于利用图像序列或几何约束方法的定位结果。

通过室内和室外公开数据集上的定位结果和显著图,我们阐述了如何利用注意力机制提取环境中具有几何意义的特征,从而实现最优的相机姿态回归性能。算法细节和源代码可访问:https://github.com/BingCS/AtLoc

 

课程须知
  • 本系列视频为AAAI 2020线上论文预分享的精选解读,欢迎大家观看
  • 如果你对AAAI相关工作感兴趣,欢迎加入AAAI 交流群,添加微信:AIyanxishe2,备注:AAAI+领域
  • 更多精彩内容,敬请大家关注研习社公开课的持续更新

授课教师

牛津大学计算机系2018级博士,研究方向为Robotics
微信扫码分享课程