References

Related
Summary
- Input
- Patches(Model Input): ($P^A,P^B$), ex) (128x128x2)
- $C_{4pt}^A$ → $(x^{TL},x^{TR},x^{BR},x^{BL},y^{TL},y^{TR},y^{BR},y^{BL})^T$ (8×1)
- Image: $I^A$ ex) (256x256x1)
- Output
- $\tilde H_{4pt}$ → $(d^{\tilde T L}_x,d^{\tilde TR}_x,d^{\tilde BR}_x,d^{\tilde BL}_x,d^{\tilde TL}_y,d^{\tilde TR} _y,d^{\tilde BR}_y,d^{\tilde BL}_y)$
- $\tilde H$~ → 3×3 Homography matrix
- $\tilde P^B$ → A aligned patch image from $I^A$ to $P^B$
- $\tilde H$ 추출 과정
- 모델의 출력으로 나온 $\tilde H_{4pt}$와 최초 임의로 잡았던 corner($C^A_{4pt}$)를 더하여 $P^B$의 왜곡된 4개의 점 추정.
- $\tilde C^B_{4pt}=(C^A_{4pt}+\tilde H_{4pt})$
- Tensor Direct Linear Transform(TDLT): 추정된 4개의 점을 TDLT 를 이용하여 3×3 Homography matrix $\tilde H$ 생성
- $\tilde H=TDLT(C^A_{4pt},\tilde C^B_{4pt})$
- $\tilde P^B$ 추출 과정
- $I^A$ 를 $P^B$의 공간으로 투영하며, $\tilde H$를 이용함.
- 여기서 Parameterized Sampling Grid Generator(PSGG) 와 Differentiable Sampling(DS) 가 이용됨. Pixel 공간을 Grid로 매핑하여 투영하는 방식이며, Backpropagation 을 위하여 Differential이 가능하도록 하였음.
- Training
- $P^B$ 와 $\tilde P^B$ 의 차이를 photometric loss(L1) 를 이용하여 계산
- $L_{PW}=\frac 1{x_i}∑_{xi}|P^B− \tilde P^B|$
Architecture

Base Model