-
Insights for CNNAI\ML\DL/Deep learning theory 2023. 9. 13. 15:35๋ฐ์ํ
* * *
CNN์ ์ปจ๋ณผ๋ฃจ์ ์ ์์น๋ณ ํจํด์ ์ฐพ๋ ์ฐ์ฐ์ด๋ค. ์ปจ๋ณผ๋ฃจ์ ์ ์ ๊ฒฝ๋ง์ ์ ์ฉํ๋ค๋ ๊ฒ์
"๋ด๊ฐ ์ง๊ธ๋ถํฐ ๋ณด์ฌ์ค ์ ๋ ฅ ์ซ์๋ค(์ฌ์ง)์๋ ์ด๋ค ์์น๋ณ ํจํด์ด ์๋ค" ๋ผ๋ ์ฌ์ ์ ๋ณด(Inductive bias) ๋ฅผ ์ ์ค ๊ฒ์ด๋ค.
ํน์ง 1. ์ ๊ฒฝ ๋ค๋ฐ connection์ ์ ๋์ด๋
- ์ธ๊ฐ์ ๋๋ ์ด๋ฏธ์ง๋ฅผ ์ธ์ํ ๋ ๋์ ์ผ๋ถ๋ถ๋ง ํ์ฑํ ์ํจ๋ค. Fully connected layer์ฒ๋ผ ์ฒซ layer์์ ๋ชจ๋ ํฝ์ ์ ๊ฐ์ ํ๊บผ๋ฒ์ ๋ชจ๋ ๋ค ๋ณด๋ ค๋ ๊ฒ์ ์ธ๊ฐ์ ์ฌ๊ณ ๋ฐฉ์์ด ์๋๋ผ๋ ๊ฒ์ด๋ค.
์ด๋ฏธ์ง๋ฅผ FC layer์ ๋ฃ๋๋ค๋ฉด ๋ชจ๋ ํฝ์ ์ ํ ๋ฒ์ ๋ฃ์ด์ ์ ๊ฒฝ๋ง์ ํต๊ณผ์ํค๊ธฐ ๋๋ฌธ์ ์ด๊ฑด ๋ญ ์๋ ๊ทธ๋ฆผ ์ฒ๋ผ ์ด๋ฏธ์ง์ ํฝ์ ๋ค ์์น๋ฅผ ์๋ก ๋ง ๋ฐ๊ฟ weight๋ฅผ ํ์ตํ๋ ๊ฒ๊ณผ ๋ค๋ฅผ ๋ฐ๊ฐ ์๋ค. Fully connected ๋ฅผ ์ฌ์ฉํ๋ค๋ฉด ์๋ ๊ทธ๋ฆผ ์ฒ๋ผ ํฝ์ ๋ค ์์น๊ฐ ๋ค์ฃฝ๋ฐ์ฃฝ์ด์ด๋ ์ฑ๋ฅ์ ์ฐจ์ด๊ฐ ์์ด์ผ ํ ๊ฒ์ด๋ค. ๋ชจ๋ ํฝ์ ๋ค ํ๋ํ๋๋ฅผ ๋ค ์ธ์ฌํ๊ฒ ๋ณด๊ณ ๋ ธ๋์ weight๋ก ์ฐ๊ฒฐ์์ผ์ ํ์ต์ํค๋ ๊ฒ์ด๊ธฐ ๋๋ฌธ์ด๋ค.
์ด๋ ๋ฏ fc layer ์ฒ๋ผ ์์น ์ ๋ณด๋ฅผ ์ฌ์ฉํ์ง ์๋ ๊ฒ์ ์ด๋ฏธ์ง ์ธ์์ ๋์์ด ๋์ง ์๋๋ค. (์ธ๊ฐ์ ์ฌ๊ณ ๋ฐฉ์๊ณผ๋ ๋ค๋ฆ)
์ด๋ฌํ ๋ฐฉ์์ ์ธ๊ฐ์ด ์ด๋ฏธ์ง๋ฅผ ๋ณด๊ณ ์ธ์ํ๋ ์ฌ๊ณ ๋ฐฉ์๊ณผ ์กฐ๊ธ ๋ค๋ฅด๋ค! (์ธ๊ฐ์ ์ฌ์ง์ ๋์ถฉ ๋ฑ! ๋ณด๊ณ ์์น๋ณ ํน์ง์ ๊ณ ๋ คํด์ ์ค์ํ ๋ถ๋ถ์ ๋ด, CNN๋ ๋ง์ฐฌ๊ฐ์ง๋ก ํฝ์ ๊ฐ๋ค ์์น๋ฅผ ๋ง๊ตฌ ์์ผ๋ฉด ์ธ์ ๋ถ๊ฐ)
CNN์ ์ฌ์ง ์์์ ์์น์ ๋ฐฐ์น๊ฐ ์ค์ํ๋ค๋ ๊ฐ์ด๋๋ฅผ ์ค๋ค.
์ธ๊ฐ: ์ด! ๋์ฝ์ ์ ๋ณด๋ ๊ฐ์์ง๋ค. ํน์ง 2. ์์น๋ณ ํน์ง์ ์ถ์ถํจ (์ด๋์ ๋ฌด์์ด ์๋์ง?)
- ์์น ์ ๋ณด๋ฅผ ์ ์งํ ์ฑ๋ก ํน์ ํ ํจํด(=feature map)์ ์ฐพ๋๋ค!
CNN์ ๊ฐ๊น์ด ์๋ ๊ฒ๋ผ๋ฆฌ ํํฐ๋ก ๋ฌถ์ด์ ์ปจ๋ณผ๋ฃจ์ ์ ํ ํ ๊ฐ ๋ ธ๋๋ก ์ฐ๊ฒฐ์ํจ๋ค. ๋ชจ๋ ํฝ์ ์ ํ๋ฒ์ connectionํ๋ ๊ฒ์ด ์๋๋ผ ๊ฐ๊น์ด ์๋ ๊ฒ๋ค๋ผ๋ฆฌ connection์ ๊ฐ์ ๋ก ๋๊ธฐ ๋๋ฌธ์ ์์น ์ ๋ณด๋ฅผ ์์ง ์๋๋ค. ์ด๋ก์จ ๊ฐ ๋ ธ๋๋ ํน์ ์์น๋ฅผ ๋ด๋นํ๊ฒ ๋๋ค.
ํํฐ๋ ์ด๋ฏธ์ง ๋๋ ํผ์ฒ๋งต์ ๋ด์ ์ ์ทจํด์ฃผ๋ ๊ฒ์ด๊ธฐ ๋๋ฌธ์ ๋ฎ์ ์ ๋๋ฅผ ์ถ๋ ฅํ๋ค. ์ฆ, ํํฐ๋ฅผ ์ด๋ฏธ์ง์ ์ค์บํด๊ฐ๋ฉด์ ๊ฐ ํํฐ์ ๋น์ทํ ๋ถ๋ถ์ ๊ฐ์กฐํด์ ํํฐ๊ฐ ์์๋ด๊ณ ์ ํ๋ ํจํด์ ์์๋ธ๋ค. ์ด๋ ํํฐ๋ ์ ๊ฐ๊ฐ์ ํฌ๊ธฐ์ด์ง๋ง ์ด๋ฏธ์ง๋ฅผ ์ผ์ชฝ ์๋ถํฐ ์ค๋ฅธ์ชฝ ์๋๋ก ์์๋๋ก ์ค์บ์ ํ๊ธฐ ๋๋ฌธ์ feature map์ ์์น ์ ๋ณด๋ฅผ ์์ง ์๋๋ค.
Summary - Conv layer๊ฐ FC layer์ ๋ค๋ฅธ์ !
- ์ฃผ๋ณ (์ผ๋ถ ์์ญ)๋ง ์ฐ๊ฒฐํ๋ค.
- ํ feature map์ ๋ํด์ ํํฐ๋ฅผ ์ค์บํ๋ฉด์ ๋ชจ๋ ์์ญ์ ๋ํด weight ์ฌ์ฌ์ฉ
- ์ฌ๋ฌ ์ข ๋ฅ์ ํํฐ๋ก ์ฌ๋ฌ ์ข ๋ฅ์ ํน์ง์ ์ถ์ถ
- CNN์ ๊ฐ ํํฐ๊ฐ ์ด๋ค ํน์ง์ ์ถ์ถํ ์ง๋ฅผ AI๊ฐ ํ์ตํ๋ค. (ํํฐ์ weight๊ฐ์ด backpropagation์ ํตํด ๊ณ์ ์
๋ฐ์ดํธ ๋๋ค)
- CNN์ด ์๋ ์๋ ์๋ ์ด๋ค ํน์ง์ ์ถ์ถํด์ผ ๊ณ ์์ด/๊ฐ์์ง๋ฅผ ์ ์ธ์ํ ๊น? ๋ฅผ ์ฐ๊ตฌ์๋ค์ด ์ง์ ์์๋ด์ผ ํ๋ค.
์ ์ convolution layer๋ฅผ ๋๋ ค๊ฐ๋ฉด์ feature map์ ๋ฝ์ผ๋ฉด ๋์ฑ ๋ค์ํ๊ณ ๊น์ ํน์ง์ ๋ฝ์ ์ ์๋ค.
CNN์ ํต๊ณผํ๋ฉด์ ๊ทธ ํจํด๋ค์ด ๊ณฑํด์ง๊ณ (๋ญ๊ฐ ๋ ์ค์ํ ํน์ง?) ํฉํด์ง๋ค(์กฐํฉ๋๋ค).
๋ ์ด์ด๊ฐ ๊น์ด์ง์๋ก low-level feature๋ค์ด high-level feature๊ฐ ๋๋ค.
์๋์์ ์ค๊ฐ์ ์๋ ๊ทธ๋ฆผ์ CNN์ ํต๊ณผํ feature map์ ๋ชจ๋ ๋ํ(ํฉ์น) ๊ฒ์ด๋ค.
(๋ ธ๋์์ ํํฐ๊ฐ ์ค์ํ๊ฒ ๋ณธ ๋ถ๋ถ์ ์๋ฏธ)
์ด๊ฒ์ ๊ธฐ์กด์ ์ด๋ฏธ์ง์ ๊ฒน์ณ ๊ทธ๋ ธ๋๋ ๋นํ๊ธฐ์ ๋ถํ๋ค์ ์ฃผ๋ชฉํด์ ๋ดค๋ค๋ ๊ฒ์ ํ์ธํ ์ ์์๋ค.
๋ฐ๋ฉด์ ๋ฐฐ๊ฒฝ์ ์์ค์๋ ์์๋ค!!
๋ฐ๋ผ์ CNN์ ๊ฐ์ฅ ํฐ ํน์ง์ ์์น ์ ๋ณด๋ฅผ ์์ง ์์ผ๋ฉด์ ์ค์ํ ๋ถ๋ถ์ ์ง์คํ๋ค๋ ๊ฒ์ด๋ผ๊ณ ๋ณผ ์ ์๋ค.
left: original image, middle: sum of feature map, right: feature map with original image ImageNet Challenge
- training: 128๋ง, validation: 5๋ง, test: 10๋ง
- class ๊ฐ์: 1000
- 2012๋ AlexNet๋ถํฐ CNN ํ์ฉ, ๋ฅ๋ฌ๋์ด ํฉ์ธ๊ธฐ ์์
- ์ด๋ฏธ์ง์ ์ฌ์ด์ฆ๊ฐ ๋ค์ํด์ resize, crop ๋ฑ์ ์ ํด์ค์ผ ํจ
'AI\ML\DL > Deep learning theory' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
Stochastic differential equation(SDE) (1) 2023.12.05 Receptive field (0) 2023.09.15 2D convolution (Conv2d) ๊ณผ์ ์ ์ดํด (0) 2023.05.28 Batch Normalization (0) 2023.05.11