ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • Insights for CNN
    AI\ML\DL/Deep learning theory 2023. 9. 13. 15:35
    ๋ฐ˜์‘ํ˜•

    *  *  *

    CNN์˜ ์ปจ๋ณผ๋ฃจ์…˜์€ ์œ„์น˜๋ณ„ ํŒจํ„ด์„ ์ฐพ๋Š” ์—ฐ์‚ฐ์ด๋‹ค. ์ปจ๋ณผ๋ฃจ์…˜์„ ์‹ ๊ฒฝ๋ง์— ์ ์šฉํ•œ๋‹ค๋Š” ๊ฒƒ์€ 

    "๋‚ด๊ฐ€ ์ง€๊ธˆ๋ถ€ํ„ฐ ๋ณด์—ฌ์ค„ ์ž…๋ ฅ ์ˆซ์ž๋“ค(์‚ฌ์ง„)์—๋Š” ์–ด๋–ค ์œ„์น˜๋ณ„ ํŒจํ„ด์ด ์žˆ๋‹ค" ๋ผ๋Š” ์‚ฌ์ „ ์ •๋ณด(Inductive bias) ๋ฅผ ์ž˜ ์ค€ ๊ฒƒ์ด๋‹ค.

     

    ํŠน์ง• 1. ์‹ ๊ฒฝ ๋‹ค๋ฐœ connection์„ ์ž˜ ๋Š์–ด๋ƒ„

    - ์ธ๊ฐ„์˜ ๋‡Œ๋Š” ์ด๋ฏธ์ง€๋ฅผ ์ธ์‹ํ•  ๋•Œ ๋‡Œ์˜ ์ผ๋ถ€๋ถ„๋งŒ ํ™œ์„ฑํ™” ์‹œํ‚จ๋‹ค. Fully connected layer์ฒ˜๋Ÿผ ์ฒซ layer์—์„œ ๋ชจ๋“  ํ”ฝ์…€์˜ ๊ฐ’์„ ํ•œ๊บผ๋ฒˆ์— ๋ชจ๋‘ ๋‹ค ๋ณด๋ ค๋Š” ๊ฒƒ์€ ์ธ๊ฐ„์˜ ์‚ฌ๊ณ ๋ฐฉ์‹์ด ์•„๋‹ˆ๋ผ๋Š” ๊ฒƒ์ด๋‹ค. 

     

    ์ด๋ฏธ์ง€๋ฅผ FC layer์— ๋„ฃ๋Š”๋‹ค๋ฉด ๋ชจ๋“  ํ”ฝ์…€์„ ํ•œ ๋ฒˆ์— ๋„ฃ์–ด์„œ ์‹ ๊ฒฝ๋ง์— ํ†ต๊ณผ์‹œํ‚ค๊ธฐ ๋•Œ๋ฌธ์— ์ด๊ฑด ๋ญ ์•„๋ž˜ ๊ทธ๋ฆผ ์ฒ˜๋Ÿผ ์ด๋ฏธ์ง€์˜ ํ”ฝ์…€๋“ค ์œ„์น˜๋ฅผ ์„œ๋กœ ๋ง‰ ๋ฐ”๊ฟ” weight๋ฅผ ํ•™์Šตํ•˜๋Š” ๊ฒƒ๊ณผ ๋‹ค๋ฅผ ๋ฐ”๊ฐ€ ์—†๋‹ค. Fully connected ๋ฅผ ์‚ฌ์šฉํ•œ๋‹ค๋ฉด ์•„๋ž˜ ๊ทธ๋ฆผ ์ฒ˜๋Ÿผ ํ”ฝ์…€๋“ค ์œ„์น˜๊ฐ€ ๋’ค์ฃฝ๋ฐ•์ฃฝ์ด์–ด๋„ ์„ฑ๋Šฅ์˜ ์ฐจ์ด๊ฐ€ ์—†์–ด์•ผ ํ•  ๊ฒƒ์ด๋‹ค. ๋ชจ๋“  ํ”ฝ์…€๋“ค ํ•˜๋‚˜ํ•˜๋‚˜๋ฅผ ๋‹ค ์„ธ์‹ฌํ•˜๊ฒŒ ๋ณด๊ณ  ๋…ธ๋“œ์™€ weight๋กœ ์—ฐ๊ฒฐ์‹œ์ผœ์„œ ํ•™์Šต์‹œํ‚ค๋Š” ๊ฒƒ์ด๊ธฐ ๋•Œ๋ฌธ์ด๋‹ค. 

    ์ด๋ ‡๋“ฏ fc layer ์ฒ˜๋Ÿผ ์œ„์น˜ ์ •๋ณด๋ฅผ ์‚ฌ์šฉํ•˜์ง€ ์•Š๋Š” ๊ฒƒ์€ ์ด๋ฏธ์ง€ ์ธ์‹์— ๋„์›€์ด ๋˜์ง€ ์•Š๋Š”๋‹ค. (์ธ๊ฐ„์˜ ์‚ฌ๊ณ ๋ฐฉ์‹๊ณผ๋„ ๋‹ค๋ฆ„)

    ์ด๋Ÿฌํ•œ ๋ฐฉ์‹์€ ์ธ๊ฐ„์ด ์ด๋ฏธ์ง€๋ฅผ ๋ณด๊ณ  ์ธ์‹ํ•˜๋Š” ์‚ฌ๊ณ ๋ฐฉ์‹๊ณผ ์กฐ๊ธˆ ๋‹ค๋ฅด๋‹ค! (์ธ๊ฐ„์€ ์‚ฌ์ง„์„ ๋Œ€์ถฉ ๋”ฑ! ๋ณด๊ณ  ์œ„์น˜๋ณ„ ํŠน์ง•์„ ๊ณ ๋ คํ•ด์„œ ์ค‘์š”ํ•œ ๋ถ€๋ถ„์„ ๋ด„, CNN๋„ ๋งˆ์ฐฌ๊ฐ€์ง€๋กœ ํ”ฝ์…€ ๊ฐ’๋“ค ์œ„์น˜๋ฅผ ๋งˆ๊ตฌ ์„ž์œผ๋ฉด ์ธ์‹ ๋ถˆ๊ฐ€)

     

    CNN์€ ์‚ฌ์ง„ ์†์—์„œ ์œ„์น˜์™€ ๋ฐฐ์น˜๊ฐ€ ์ค‘์š”ํ•˜๋‹ค๋Š” ๊ฐ€์ด๋“œ๋ฅผ ์ค€๋‹ค. 

    ์ธ๊ฐ„: ์–ด! ๋ˆˆ์ฝ”์ž…์„ ๋ณด๋‹ˆ ๊ฐ•์•„์ง€๋„ค.

     

    ํŠน์ง• 2. ์œ„์น˜๋ณ„ ํŠน์ง•์„ ์ถ”์ถœํ•จ (์–ด๋””์— ๋ฌด์—‡์ด ์žˆ๋Š”์ง€?)

    - ์œ„์น˜ ์ •๋ณด๋ฅผ ์œ ์ง€ํ•œ ์ฑ„๋กœ ํŠน์ •ํ•œ ํŒจํ„ด(=feature map)์„ ์ฐพ๋Š”๋‹ค!

    CNN์€ ๊ฐ€๊นŒ์ด ์žˆ๋Š” ๊ฒƒ๋ผ๋ฆฌ ํ•„ํ„ฐ๋กœ ๋ฌถ์–ด์„œ ์ปจ๋ณผ๋ฃจ์…˜์„ ํ•œ ํ›„ ๊ฐ ๋…ธ๋“œ๋กœ ์—ฐ๊ฒฐ์‹œํ‚จ๋‹ค. ๋ชจ๋“  ํ”ฝ์…€์„ ํ•œ๋ฒˆ์— connectionํ•˜๋Š” ๊ฒƒ์ด ์•„๋‹ˆ๋ผ ๊ฐ€๊นŒ์ด ์žˆ๋Š” ๊ฒƒ๋“ค๋ผ๋ฆฌ connection์„ ๊ฐ•์ œ๋กœ ๋Š๊ธฐ ๋•Œ๋ฌธ์— ์œ„์น˜ ์ •๋ณด๋ฅผ ์žƒ์ง€ ์•Š๋Š”๋‹ค. ์ด๋กœ์จ ๊ฐ ๋…ธ๋“œ๋Š” ํŠน์ • ์œ„์น˜๋ฅผ ๋‹ด๋‹นํ•˜๊ฒŒ ๋œ๋‹ค. 

    ํ•„ํ„ฐ๋Š” ์ด๋ฏธ์ง€ ๋˜๋Š” ํ”ผ์ฒ˜๋งต์— ๋‚ด์ ์„ ์ทจํ•ด์ฃผ๋Š” ๊ฒƒ์ด๊ธฐ ๋•Œ๋ฌธ์— ๋‹ฎ์€ ์ •๋„๋ฅผ ์ถœ๋ ฅํ•œ๋‹ค. ์ฆ‰, ํ•„ํ„ฐ๋ฅผ ์ด๋ฏธ์ง€์— ์Šค์บ”ํ•ด๊ฐ€๋ฉด์„œ ๊ฐ ํ•„ํ„ฐ์™€ ๋น„์Šทํ•œ ๋ถ€๋ถ„์„ ๊ฐ•์กฐํ•ด์„œ ํ•„ํ„ฐ๊ฐ€ ์•Œ์•„๋‚ด๊ณ ์ž ํ•˜๋Š” ํŒจํ„ด์„ ์•Œ์•„๋‚ธ๋‹ค. ์ด๋•Œ ํ•„ํ„ฐ๋Š” ์ œ๊ฐ๊ฐ์˜ ํฌ๊ธฐ์ด์ง€๋งŒ ์ด๋ฏธ์ง€๋ฅผ ์™ผ์ชฝ ์œ„๋ถ€ํ„ฐ ์˜ค๋ฅธ์ชฝ ์•„๋ž˜๋กœ ์ˆœ์„œ๋Œ€๋กœ ์Šค์บ”์„ ํ•˜๊ธฐ ๋•Œ๋ฌธ์— feature map์€ ์œ„์น˜ ์ •๋ณด๋ฅผ ์žƒ์ง€ ์•Š๋Š”๋‹ค. 

     

     

    Summary - Conv layer๊ฐ€ FC layer์™€ ๋‹ค๋ฅธ์ !

    • ์ฃผ๋ณ€ (์ผ๋ถ€ ์˜์—ญ)๋งŒ ์—ฐ๊ฒฐํ•œ๋‹ค. 
    • ํ•œ feature map์— ๋Œ€ํ•ด์„œ ํ•„ํ„ฐ๋ฅผ ์Šค์บ”ํ•˜๋ฉด์„œ ๋ชจ๋“  ์˜์—ญ์— ๋Œ€ํ•ด weight ์žฌ์‚ฌ์šฉ
    • ์—ฌ๋Ÿฌ ์ข…๋ฅ˜์˜ ํ•„ํ„ฐ๋กœ ์—ฌ๋Ÿฌ ์ข…๋ฅ˜์˜ ํŠน์ง•์„ ์ถ”์ถœ
    • CNN์€ ๊ฐ ํ•„ํ„ฐ๊ฐ€ ์–ด๋–ค ํŠน์ง•์„ ์ถ”์ถœํ• ์ง€๋ฅผ AI๊ฐ€ ํ•™์Šตํ•œ๋‹ค. (ํ•„ํ„ฐ์˜ weight๊ฐ’์ด backpropagation์„ ํ†ตํ•ด ๊ณ„์† ์—…๋ฐ์ดํŠธ ๋œ๋‹ค)
      • CNN์ด ์—†๋Š” ์˜›๋‚ ์—๋Š” ์–ด๋–ค ํŠน์ง•์„ ์ถ”์ถœํ•ด์•ผ ๊ณ ์–‘์ด/๊ฐ•์•„์ง€๋ฅผ ์ž˜ ์ธ์‹ํ• ๊นŒ? ๋ฅผ ์—ฐ๊ตฌ์ž๋“ค์ด ์ง์ ‘ ์•Œ์•„๋‚ด์•ผ ํ–ˆ๋‹ค. 

     

    ์ ์  convolution layer๋ฅผ ๋Š˜๋ ค๊ฐ€๋ฉด์„œ feature map์„ ๋ฝ‘์œผ๋ฉด ๋”์šฑ ๋‹ค์–‘ํ•˜๊ณ  ๊นŠ์€ ํŠน์ง•์„ ๋ฝ‘์„ ์ˆ˜ ์žˆ๋‹ค. 

    CNN์„ ํ†ต๊ณผํ•˜๋ฉด์„œ ๊ทธ ํŒจํ„ด๋“ค์ด ๊ณฑํ•ด์ง€๊ณ  (๋ญ๊ฐ€ ๋” ์ค‘์š”ํ•œ ํŠน์ง•?) ํ•ฉํ•ด์ง„๋‹ค(์กฐํ•ฉ๋œ๋‹ค).

    ๋ ˆ์ด์–ด๊ฐ€ ๊นŠ์–ด์งˆ์ˆ˜๋ก low-level feature๋“ค์ด high-level feature๊ฐ€ ๋œ๋‹ค.

     

    ์•„๋ž˜์—์„œ ์ค‘๊ฐ„์— ์žˆ๋Š” ๊ทธ๋ฆผ์€ CNN์„ ํ†ต๊ณผํ•œ feature map์„ ๋ชจ๋‘ ๋”ํ•œ(ํ•ฉ์นœ) ๊ฒƒ์ด๋‹ค.

    (๋…ธ๋ž€์ƒ‰์€ ํ•„ํ„ฐ๊ฐ€ ์ค‘์š”ํ•˜๊ฒŒ ๋ณธ ๋ถ€๋ถ„์„ ์˜๋ฏธ)

    ์ด๊ฒƒ์„ ๊ธฐ์กด์˜ ์ด๋ฏธ์ง€์™€ ๊ฒน์ณ ๊ทธ๋ ธ๋”๋‹ˆ ๋น„ํ–‰๊ธฐ์˜ ๋ถ€ํ’ˆ๋“ค์„ ์ฃผ๋ชฉํ•ด์„œ ๋ดค๋‹ค๋Š” ๊ฒƒ์„ ํ™•์ธํ•  ์ˆ˜ ์žˆ์—ˆ๋‹ค.

    ๋ฐ˜๋ฉด์— ๋ฐฐ๊ฒฝ์€ ์•ˆ์ค‘์—๋„ ์—†์—ˆ๋‹ค!!

    ๋”ฐ๋ผ์„œ CNN์˜ ๊ฐ€์žฅ ํฐ ํŠน์ง•์€ ์œ„์น˜ ์ •๋ณด๋ฅผ ์žƒ์ง€ ์•Š์œผ๋ฉด์„œ ์ค‘์š”ํ•œ ๋ถ€๋ถ„์— ์ง‘์ค‘ํ•œ๋‹ค๋Š” ๊ฒƒ์ด๋ผ๊ณ  ๋ณผ ์ˆ˜ ์žˆ๋‹ค. 

    left: original image, middle: sum of feature map, right: feature map with original image

     

    ImageNet Challenge

    • training: 128๋งŒ, validation: 5๋งŒ, test: 10๋งŒ
    • class ๊ฐœ์ˆ˜: 1000
    • 2012๋…„ AlexNet๋ถ€ํ„ฐ CNN ํ™œ์šฉ, ๋”ฅ๋Ÿฌ๋‹์ด ํœฉ์“ธ๊ธฐ ์‹œ์ž‘
    • ์ด๋ฏธ์ง€์˜ ์‚ฌ์ด์ฆˆ๊ฐ€ ๋‹ค์–‘ํ•ด์„œ resize, crop ๋“ฑ์„ ์ž˜ ํ•ด์ค˜์•ผ ํ•จ

    'AI\ML\DL > Deep learning theory' ์นดํ…Œ๊ณ ๋ฆฌ์˜ ๋‹ค๋ฅธ ๊ธ€

    Stochastic differential equation(SDE)  (1) 2023.12.05
    Receptive field  (0) 2023.09.15
    2D convolution (Conv2d) ๊ณผ์ •์˜ ์ดํ•ด  (0) 2023.05.28
    Batch Normalization  (0) 2023.05.11
Designed by Tistory.