RSS

[review] Inverse Depth Parametrization for Monocular SLAM

10 Jun

발표 : Transactions on Robotics, 2008

제목 : Inverse Depth Parametrization for Monocular SLAM

저자 : Javier Civera, Andrew J. Davison, and J. M. Mart´ınez Montiel

소속 : Universidad de Zaragoza, Spain. (A. Davison은 imperial college).

페이퍼 : http://webdiis.unizar.es/~jcivera/papers/civera_etal_tro08.pdf

동영상 : http://webdiis.unizar.es/~jcivera/videos/civera_tro08_indoors.avi

http://webdiis.unizar.es/~jcivera/videos/civera_tro08_outdoors.avi

http://webdiis.unizar.es/~jcivera/videos/civera_tro08_loop_closing.avi

http://webdiis.unizar.es/~jcivera/videos/civera_tro08_loop_closing_id2xyz_conversion.avi

소스코드 : http://webdiis.unizar.es/~jcivera/code/EKF_monoSLAM_1pRANSAC_1.01.zip

https://svn.openslam.org/data/svn/ekfmonoslam/

이전에 review 했던 논문 “1-Point RANSAC for EKF Filtering. Application to Real-Time Structure from Motion and Visual Odometry” 에 보면 SLAM에서 map point를 inverse depth로 표현했었다.  그래서 덩달아 이 논문도 보게 됬다.

제목 그대로 이 논문의 핵심은 inverse depth이다.  inverse depth를 쓰는 이유를 두 가지들 들어 설명하고 있다.

하나는 SLAM이 주로 실시간 application인 만큼, 새로운 3D point의 기존 map으로의 투입이 빨리 진행되야 한다는 것이다.  기존의 연구들은 3D point의 X, Y, Z 좌표가 어느 정도 확실해 질 때까지 기존 map에 넣지 않고 따로 처리했다고 한다.  그러니까, 그러한 new 3D point들의 카메라 포즈 estimation에 기여하는데 걸리는 시간이 오래 걸리고, 심지어는 영원히 기존 map으로 편입되지 못했다고 한다.

다른 하나는 (결국 비슷한 얘기인데), point at infinity(PAI)는 homogeneous coordinate 형태로 컴퓨터 비젼, 즉 offline Structure from Motion 에서도 아주 중요한 역할을 하는 단서인데, online SLAM에서는 아무런 역할을 못하고 있다는 것이다.  따라서 PAI를 제대로 표현할 방법이 필요하다는 것이다.

일반적인 3D 좌표 표현법을 XYZ 표현(3-vector)이라고 하면, inverse depth representation은 6-vector로서 XYZ representation과 아래와 같은 호환 관계가 있다.

Clipboard04

여기서 x_i, y_i, z_i, \rho_i는 아래 그림에 나타나 있고, \theta_i, \phi_i 는 단위 방향 vector \bf{m}을 결정하는 azimuth와 elevation이다.

Clipboard05

Inverse depth representation를 써야하는 이유에 대해서는 chapter IV의 시작에서 아래와 같은 문장으로 설명하고 있다.  맞는 말이긴 한데 아직 와닿지는 않는다.

The more linear the measurement equation is, the better a Kalman filter performs. This section is devoted to presenting an analysis of measurement equation linearity for both XYZ and inverse depth codings. These linearity analyses theoretically support the superiority of the inverse depth coding.

이에 대한 설명으로 아래 그림을 기준으로 얘기하고 있다.

Clipboard06

 

Kalman filter 특성 상, 모든 관계가 linear하다고 보는데, 첫 번째 view에서 3차원 점의 depth가 Gaussian 분포를 띄면, XYZ representation의 경우 그 분포가 두 번째 view에서 image에 맺힐 때 Gaussian 분포가 되지 않는다.  즉, Gaussian의 mean을 기준으로 perspective에 의해 카메라로 부터 멀리 있는 분포가 두 번째 카메라 view에서 좁은 영역에 맺히고, 가까이 있는 분포가 넓은 영역에 맺힌다.  따라서 (a)처럼 비대칭의 covariance가 나오게 되며, 이는 실제 Kalman filter에서 covariance matrix로 나타낼 수 있는 Gaussian distribution의 표현 역량을 넘어선다.  극단적으로 두 카메라가 서로 수직으로 바라보고 있다면(즉, wide baseline) 이러한 비 대칭성은 사라질 것이다.  하지만 inverse depth representation을 쓰면 Gaussian 분포를 띄는 것은 inverse depth인 \rho이고, depth에 대해서는 그림 (b)와 같이 비대칭 분포를 띈다.  이것이 두 번째 카메라 view의 measurement uncertainty로 전파될 때는 어느정도 대칭인 분포로 전파 된다는 것이다.  암튼 linearity는 있으면 좋은 것이여.

그 measurement uncertainty의 linearity를 수치화 보면, 아래와 같다.

Clipboard07

Clipboard08

 

L_d는 XYZ representation일 때, L_\rho는 inverse depth representation 일 때의 linearity이다.  L은 0 이상의 값이며, 0 일 때 완전히 linear, 값이 커지면 그 만큼 non-linear 해 짐을 나타낸다.  다른 변수들은 일단 제쳐 두고, 두 view 사이의 각도 \alpha만 보더라도 L_d의 경우 \alpha가 작아지면 값이 커지지만, L_\rho의 경우 \alpha가 작아짐에 따라 값이 작아진다.  즉, 아주 smooth하고 천천히 움직이는 camera motion의 경우 inverse depth representation을 쓰는게 해당 3D point의 measurement equation linearity 측면에서 이득을 본다.

하지만 inverse depth representation은 6차원 vector, XYZ representation은 3차원의 vector, 즉 2배 차이가 나고 covariance나 Jacobian matrix에서도 그 만큼 덩치가 커질 테니, 해당 점에 대해서, 어느 정도 wide baseline을 확보하게 되면 XYZ representation으로 바꾸는게 났다고 한다.  이것은 논문 나머지 부분에 나오나, 귀찮아서 오늘은 여기까지…

Advertisements
 

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s

 
%d bloggers like this: