-
Super resolution (SR) techniqueAI\ML\DL/๋ ผ๋ฌธ ๋ฆฌ๋ทฐ 2023. 6. 17. 17:46๋ฐ์ํ
Super Resolution
- ์ ํด์๋ (Low Resolution, LR) ์์์ผ๋ก๋ถํฐ ๊ณ ํด์๋ (High Resolution, HR) ์์์ ์์ฑํ๋ ๊ธฐ์ ์ด๋ค.
- ์ ํด์๋ ์ด๋ฏธ์ง๋ ํด์๋๊ฐ ๋ฎ์ ์ธ๋ถ ์ ๋ณด๊ฐ ํ๋ฆฟํ๊ฑฐ๋ ์์ค๋๋ ๊ฒฝํฅ์ด ์๋๋ฐ, ์ด๋ฌํ ์ ํด์๋ ์ด๋ฏธ์ง๋ฅผ ๊ณ ํด์๋ ์ด๋ฏธ์ง๋ก ๋ณํํ๊ฑฐ๋ ๋ณต์ํ์ฌ ๋ ์ ๋ช ํ๊ณ ์ธ๋ถ์ ์ธ ์ ๋ณด๋ฅผ ํฌํจํ๋ ์ด๋ฏธ์ง๋ฅผ ์์ฑํจ
SR ์ ํฌ๊ฒ ํ๋์ ์ด๋ฏธ์ง๋ฅผ ์ด์ฉํ๋์ง, ์ฌ๋ฌ ์ด๋ฏธ์ง๋ฅผ ์ด์ฉํ๋์ง์ ๋ฐ๋ผ Single Image Super Resolution (SISR), Multi Image Super Resolution (MISR) ๋ก ๋๋๋๋ฐ, ์ฃผ๋ก SISR์ ๋ํ ์ฐ๊ตฌ๊ฐ ์ฃผ๋ฅผ ์ด๋ฃฌ๋ค.
Super resolution ๊ธฐ์ ์ ์ฃผ๋ก ๋ค์๊ณผ ๊ฐ์ ๋ฐฉ๋ฒ์ผ๋ก ๊ตฌํ๋ ์ ์๋ค.
1. ๋ณด๊ฐ๋ฒ (Interpolation): ์ฃผ๋ณ ํฝ์ ์ ๊ฐ์ ์ฌ์ฉํ์ฌ ํฝ์ ์ ๋ณด๊ฐํจ์ผ๋ก์จ ์ด๋ฏธ์ง์ ํด์๋๋ฅผ ํฅ์์ํค๋ ๋ฐฉ๋ฒ
2. ์ ๊ฒฝ๋ง ๊ธฐ๋ฐ ๋ฐฉ๋ฒ: ๋ฅ๋ฌ๋(CNN)์ ํ์ฉํ์ฌ ์ ํด์๋ ์ด๋ฏธ์ง์ ๊ณ ํด์๋ ์ด๋ฏธ์ง ์ฌ์ด์ ๋งคํ์ ํ์ตํ๋ ๋ฐฉ๋ฒ
- ์ฌ๋ฌ ๊ฒน์ผ๋ก ์์ ๋ค์ธต ๋คํธ์ํฌ๋ฅผ ์ฌ์ฉํ์ฌ ์ ํด์๋ ์ ๋ ฅ๊ณผ ๊ณ ํด์๋ ์ถ๋ ฅ ๊ฐ์ ๋ณต์กํ ๋น์ ํ์ ๊ด๊ณ๋ฅผ ์ ๋ฐํ๊ฒ ๋ถ์ํ์ฌ ๋ณด๋ค ์ ํํ๊ฒ ๋ณํํ ์ ์๋ ํฉ์ฑ๊ณฑ ์ปค๋ ํ๋ผ๋ฏธํฐ๋ฅผ ํ์ตํ๋ค[1].
3. ์์ธก ๊ธฐ๋ฐ ๋ฐฉ๋ฒ: ์ด๋ฏธ์ง์ ํต๊ณ์ ์ธ ์์ฑ์ด๋ ๊ตฌ์กฐ๋ฅผ ๋ถ์ํ์ฌ ์ ํด์๋ ์ด๋ฏธ์ง๋ฅผ ๊ณ ํด์๋๋ก ์์ธกํ๋ ๋ฐฉ๋ฒ
๋ฅ๋ฌ๋ ๊ธฐ๋ฐ์ ์ดํด์ํ ์๊ณ ๋ฆฌ์ฆ ๊ธฐ์ ํํฉ ๋ฐ ๋ํฅ
1) SRCNN ๊ณผ FSRCNN
<SRCNN>
- SRCNN์ ์ต์ด๋ก end-to-end ๋ฐฉ์์ผ๋ก ๋ชจ๋ ๋จ๊ณ๋ฅผ ํ๋์ ํตํฉ๋ ๋คํธ์ํฌ์์ ์ฒ๋ฆฌํ๋ค.
- ์ ๋ ฅ ์์์ธ LR ์์์๋ *๋ฐ์ดํ๋น ๋ณด๊ฐ๋ฒ์ ์ ์ฉํด ์ ์ค์ผ์ผ(LR->HR ํ๊ธฐ ์ํด ์ด๋ฏธ์ง์ ํฌ๊ธฐ๋ฅผ ํ๋ํ๋ ๊ณผ์ , resolution ํ๋)๋ง ๋ ์ด๋ฏธ์ง๋ฅผ ์ฌ์ฉํ๋ค. ์ฆ, CNN ๋คํธ์ํฌ๋ฅผ ํต๊ณผํ๋ฉด์ ์์์ ํด์๋์๋ ๋ณํ๊ฐ ์๋ค. ํด๋น ์ฐ๊ตฌ๋ ๋งค์ฐ ๋จ์ํ ๋ฐฉ๋ฒ์ผ๋ก ๊ธฐ์กด์ ์ ํธ์ฒ๋ฆฌ ๊ด์ ์์ ๋ฐ๋ผ๋ณด์๋ ์ดํด์ํ ๋ฌธ์ ๋ฅผ ๋ฅ๋ฌ๋ ๊ด์ ์์ ํ์ด๋ด๋ฉด์ ๋์ ์ฑ๋ฅ์ ๋ณด์ฌ์ค๋ค๋ ์ ์์ ์์๊ฐ ์๋ค.
* ๋ฐ์ดํ๋น ๋ณด๊ฐ๋ฒ์ ์ธ์ ํ ํฝ์ ๋ค ์ฌ์ด์ ๊ด๊ณ๋ฅผ ์ด์ฉํ์ฌ ์๋ก์ด ํฝ์ ๊ฐ์ ์์ฑํ๋ค. ์ด๋ฅผ ์ํด ์ฃผ๋ณ์ 16๊ฐ์ ํฝ์ ๊ฐ์ ์ฌ์ฉํ๋ค. ๊ฐ ํฝ์ ์ ๊ทธ ์ฃผ๋ณ์ ํฝ์ ๋ค์ ๊ฐ์ค ํ๊ท ์ ๊ณ์ฐํ์ฌ ์๋ก์ด ๊ฐ์ ํ ๋น๋ฐ๊ฒ ๋๋ค.
- ๋จ์ํ 3๊ณ์ธต์ FCN ๊ตฌ์กฐ๋ฅผ ๊ฐ์ง๋ค.
โถ ์ฒซ๋ฒ์งธ ์ธต์ ํจ์น๋ฅผ ์ถ์ถํ๋ ์ญํ ๋ก LR ์์์์ ํจ์น๋ค์ ์ถ์ถํ์ฌ feature map ๋จ์๋ก ํํ
โท ๋๋ฒ์งธ ์ธต์ ๊ฐ๊ฐ์ feature map์ ๋ ๋ค๋ฅธ feature map์ผ๋ก ๋น์ ํ ๋งคํํ๋ ์ญํ ์ ํ๋ค.
โธ ๋น์ ํ์ ์ผ๋ก ๋งคํ๋ feature map๋ค์ ๋ฐํ์ผ๋ก HR ์์์ ์์ฑํด๋ธ๋ค.
<FSRCNN>
- ๊ธฐ์กด SRCNN ๋๋น ๊ฐ์ฅ ํฐ ์ฐจ์ด์ ์ ์ ๋ ฅ์ผ๋ก ๋ค์ด๊ฐ๋ LR ์์์ ๋ฐ์ดํ๋น ๋ณด๊ฐ๋ฒ์ ์ฌ์ฉํ์ฌ ์ ์ค์ผ์ผ๋งํ์ง ์๊ณ ๊ทธ๋๋ก ๋คํธ์ํฌ์ ๋ฃ๋ ๋ฐฉ์์ ์ฌ์ฉํ ๊ฒ์ด๋ค.
- ์์์ ํด์๋๋ฅผ ๋ณํํ๊ธฐ ์ํด Deconvolution ์ธต์ ์ฌ์ฉํจ; feature map ์ ๊ฐ๋ก ์ธ๋ก ํฌ๊ธฐ๋ฅผ ํค์์ฃผ์ด ์ํ๋ ํด์๋๋ก ์ถ๋ ฅ ์์์ ๋๋ฆด ์ ์๋ค. (์ ์ค์ผ์ผ๋งํ๊ณ ์ ํ๋ ๋ฐฐ์์ ์ ๊ณฑ์ ๋น๋กํ์ฌ ์ฐ์ฐ๋ ๊ฐ์์ํฌ์ ์๋ค.)
- SRCNN์ ๋นํด ๋ฎ์ ํ๋ผ๋ฏธํฐ ์์ ๋์ ์ฐ์ฐ์๋, ์ฑ๋ฅ ํฅ์
2) VDSR (Very Deep Super Resolution)
- ์ผ๋ฐ์ ์ผ๋ก ๊น์ ๋ฅ๋ฌ๋ ๋ชจ๋ธ๋ก ๊น์ ๋คํธ์ํฌ๋ฅผ ์ค๊ณํ๋ฉด ์ฐ์ฐ๋์ด ๋ง์์ง๊ณ ํ๋ผ๋ฏธํฐ ์๊ฐ ์ฆ๊ฐํ๋ค. ๊ทธ๋ฌ๋ ๊น์ ๋คํธ์ํฌ๋ฅผ ํ์ต ์ ์ญ์ ํ ๊ณผ์ ์์ vanishing gradient ํน์ gradient exploding ๋ฌธ์ ๊ฐ ๋ฐ์ํ์ฌ ํํฐ ํ๋ผ๋ฏธํฐ๋ค์ด ์ ๋๋ก ํ์ต๋์ง ์๋ ๋ฌธ์ ๋ฐ์๊ฐ๋ฅ
- ์ด๋ฌํ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๊ธฐ ์ํด ์์ฐจ ํ์ต์ด๋ผ๋ ์๋ก์ด ํ์ต ๋ฐฉ๋ฒ์ผ๋ก ResNet ์ ์ (Kaiming He)
- ์ ๋ ฅ LR ์์์ ์ต์ข ์ถ๋ ฅ HR ์์์ ๋ํด์ฃผ๊ณ ๋ ์์์ ์ฐจ์ด ๊ฐ์ ํ์ตํ๋ ๋ฐฉ๋ฒ
- ๋ฐ์ดํ๋น ๋ณด๊ฐ๋ฒ์ผ๋ก ์ ์ค์ผ์ผ๋ง๋ ์ ๋ ฅ LR ์์๊ณผ ์ถ๋ ฅ HR ์์์ ๋คํธ์ํฌ๋ก ํ์ต
- ๊ทธ๋ฌ๋ SRCNN๊ณผ ๋ค๋ฅด๊ฒ ์ ๋ ฅ LR ์์๊ณผ ์ถ๋ ฅ HR ์์์ ์ฐจ์ด (์์ฐจ)๋ฅผ ๋คํธ์ํฌ์ ์ ๋ ฅํ์ฌ ๋ง์ง๋ง ์ถ๋ ฅ๋จ์์ ์ ๋ ฅ LR ์์์ ๋ํด์ค๋ค.
- ์๋์ ์ผ๋ก ๊น์ 20์ธต์ ๋คํธ์ํฌ๋ฅผ ๊ฐ์ง๋ค (Very deep super resolution)
3) EDSR
- ์์ฐจ ํ์ต์ ์ด์ฉํ ๊น์ ๋คํธ์ํฌ(32๊ฐ ์ด์์ ์ธต, ์ฑ๋์/ํ๋ผ๋ฏธํฐ ์ ์ฆ๊ฐ) ์ค๊ณ ๋ฐฉ๋ฒ ์ค ํ๋
- ์์ ์ ์ผ๋ก ํ์ตํ๊ธฐ ์ํด ๋คํธ์ํฌ๋ฅผ Residual Block ๋ณ๋ก ๋๋๊ณ ๊ฐ๊ฐ์ Skip Connection ์ ์ฌ์ฉํด ์ฐ๊ฒฐํ๋ฉฐ ํํฐ ํ๋ผ๋ฏธํฐ๋ค์ด ๋ ์ฝ๊ฒ ์ต์ ํ๋๋๋ก ๋คํธ์ํฌ๋ฅผ ์ค๊ณํจ
- SPCNN (Sub Pixel Convolutional Neural Network)์ ์ฌ์ฉํด ํ์ต๊ณผ์ ์์ ์ ๋ ฅ LR ์์์ ํด์๋๋ฅผ ํค์
- SPCNN์ ์ฌ์ฉํ๋ค๋ฉด CNN์ ๊ฑฐ์น ๋ค ๋ง์ง๋ง ๋ ์ด์ด์์ feature map๊ฐ์๋ฅผ ์ ์ค์ผ์ผ๋ง ๋ฐฐ์์ ์ ๊ณฑ ๊ฐ๋งํผ ๋๋ ค์ค ๋ค ์ด๋ฅผ ํฝ์ ์ ํ ์ฐ์ฐ์ ํตํ์ฌ ์ ์ ํ ๋ฐฐ์นํ์ฌ ์ํ๋ ํด์๋๋ฅผ ์ป์ ์ ์๋ค.
[1] ์์ ๋ฆผ, ๊ฐ์์ฃผ, ๋ฅ๋ฌ๋ ๊ธฐ๋ฐ Super Resolution ๊ธฐ์ ์ ํํฉ ๋ฐ ์ต์ ๋ํฅ (2020)
'AI\ML\DL > ๋ ผ๋ฌธ ๋ฆฌ๋ทฐ' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
Inception Net (2014.09) (0) 2023.09.17 VGG Net (2014.09) (0) 2023.09.16 SSD: Single-Shot Multibox Detector (0) 2023.08.24 cyclic ordinal regression ํ์ต๋ฒ (0) 2023.07.28