1. Motivation

Monocular depth estimation에서 물체의 경계(edge) 및 구조적 정보를 정확히 포착하는 것이 성능 향상의 핵심이다. 기존의 CNN 기반 방법들은 글로벌한 컨텍스트 표현에 초점을 맞추다 보니 로컬한 엣지 구조를 충분히 활용하지 못하는 경향이 있었다.

EdgeConv는 원래 포인트 클라우드 처리에서 제안된 연산으로, 이웃 포인트들 간의 관계를 그래프 형태로 모델링한다. 이를 2D 이미지 depth estimation에 적용하여 엣지의 구조적 정보를 활용하는 연구가 시도되어 왔다.

3. Proposed Method

패치 단위로 잘라낸 임베딩 매트릭스에 대해 EdgeConv를 계산함으로써, 엣지의 구조적 정보를 명시적으로 모델링한다. 여기에 더하여 EdgeConv-Attention 모듈을 제안하여 중요한 엣지 영역에 집중적으로 어텐션을 부여한다.

  • EdgeConv: 패치 단위 임베딩에서 이웃 간의 관계를 모델링하여 구조적 엣지 정보를 추출
  • EdgeConv-Attention: EdgeConv 출력에 어텐션을 추가하여 중요도가 높은 엣지 영역을 강조

4. Experiments

Monocular depth estimation 벤치마크에서 EdgeConv와 Attention 모듈의 효과를 검증하였다. 엣지 영역에서의 뎁스 정확도 향상이 핵심 지표로 사용된다.

5. Conclusion & Limitation

엣지 구조를 명시적으로 모델링하는 EdgeConv와 어텐션 메커니즘을 결합한 방법은 depth boundary 주변의 정확도를 끌어올리는 데 기여한다. 다만, 패치 단위 처리로 인한 연산 비용 및 경계 처리 방식에 대한 추가 분석이 필요하다.