[논문] Fine-grained Semantics-aware Representation Enhancement for Self-Supervised Monocular Depth Estimation
1. Motivation Self-supervised monocular depth estimation에서 photometric consistency만으로는 극복하기 어려운 한계가 존재한다. 텍스쳐가 약한 영역이나 물체 경계에서 성능 향상이 쉽지 않고, 동적 물체의 존재로 인해 pose network의 훈련도 어렵다. 이 논문은 이러한 한계를 명시적인 supervision 없이 implicit한 representation enhancement로 극복하는 방법을 제안한다. 2. Related Work SfM-Learner 계열의 self-supervised 방법만으로는 texture의 weakness를 극복하기 어렵다. 최근 연구들은 cross-domain learning으로 장면의 semantic 정보를 활용하여 depth 추정 정확도를 높이려 했다. 예를 들어 동적 물체를 제거하거나, semantic instance로부터 물체 모션을 명시적으로 통합하는 방법이 있었다. ...