ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • λ”₯λŸ¬λ‹ μž…λ¬Έμ„œ μΆ”μ²œ: ν˜νŽœν•˜μž„μ˜ γ€ŠEasy! λ”₯λŸ¬λ‹γ€‹ 리뷰
    기타 2025. 1. 28. 21:19
    λ°˜μ‘ν˜•

    μš”μ¦˜ AI λ”₯λŸ¬λ‹ 뢄야에 관심을 κ°–λŠ” 뢄듀이 늘고 μžˆμ§€λ§Œ, μ–΄λ””μ„œλΆ€ν„° μ‹œμž‘ν•΄μ•Ό 할지 λ§‰λ§‰ν•΄ν•˜μ‹œλŠ” κ²½μš°κ°€ λ§ŽμŠ΅λ‹ˆλ‹€.

     

    μˆ˜λ§Žμ€ λ”₯λŸ¬λ‹ μ±… μ€‘μ—μ„œ 초보자의 λˆˆλ†’μ΄λ₯Ό λ§žμΆ”λ©΄μ„œλ„ μ „κ³΅μžμ˜ κΉŠμ΄κΉŒμ§€ μ΄ν•΄μ‹œμΌœμ£ΌλŠ” 책을 μ°ΎκΈ°λž€ 쉽지 μ•Šμ€λ°μš”, 

    그런 μ μ—μ„œ, 졜근 읽은 ν˜νŽœν•˜μž„μ˜ γ€ŠEasy! λ”₯λŸ¬λ‹γ€‹ 은 이런 고민을 λ‹¨λ²ˆμ— ν•΄κ²°ν•΄μ£ΌλŠ” μ±…μ΄μ—ˆμŠ΅λ‹ˆλ‹€.

     

    이 μ±…μ˜ μ €μžμΈ ν˜νŽœν•˜μž„ λ‹˜μ€ 이미 λ”₯λŸ¬λ‹ κ°•μ˜λ‘œ 유λͺ…ν•œ 만큼, μ±…μ—μ„œλ„ λ³΅μž‘ν•œ κ°œλ…μ„ μ§κ΄€μ μœΌλ‘œ ν’€μ–΄λ‚΄λŠ” λŠ₯λ ₯이 λ‹λ³΄μž…λ‹ˆλ‹€.

    μ–΄λ €μš΄ μˆ˜μ‹μ„ λ‚˜μ—΄ν•˜κΈ°λ³΄λ‹€λŠ”, 쉽고 λͺ…ν™•ν•œ λΉ„μœ μ™€ 그림을 ν™œμš©ν•΄ λ…μžκ°€ κ°œλ…μ„ μ΄ν•΄ν•˜λ„λ‘ λ•λŠ” 점이 μΈμƒμ μ΄μ—ˆμŠ΅λ‹ˆλ‹€.

     

    기초 κ°œλ…λΆ€ν„° μ΅œμ‹  AI λͺ¨λΈκΉŒμ§€ μžμ—°μŠ€λŸ½κ²Œ μ—°κ²°λ˜λŠ” 흐름 덕뢄에, λ”₯λŸ¬λ‹μ„ 처음 λ°°μš°λŠ” μ‚¬λžŒλΏλ§Œ μ•„λ‹ˆλΌ, 기쑴의 κ°œλ…μ„ μ •λ¦¬ν•˜κ³  싢은 μ „κ³΅μžμ—κ²Œλ„ μœ μ΅ν•œ μ±…μ΄λΌλŠ” 생각이 λ“€μ—ˆμŠ΅λ‹ˆλ‹€.

     


    였늘의 정리: γ€ŠEasy! λ”₯λŸ¬λ‹γ€‹ 챕터 3

    챕터 3μ—μ„œλŠ” MLP(Multi-Layer Perceptron), μ—­μ „νŒŒ(Backpropagation) λ“± λ”₯λŸ¬λ‹μ˜ λ‚΄λΆ€ 핡심 μš”μ†Œλ“€μ— λŒ€ν•œ μ„€λͺ…이 λ‚˜μ˜΅λ‹ˆλ‹€.

    MLP

    MLPλŠ” μž…λ ₯(Input) λ ˆμ΄μ–΄, 좜λ ₯(Output) λ ˆμ΄μ–΄, 그리고 ν•˜λ‚˜ μ΄μƒμ˜ νžˆλ“ (Hidden) λ ˆμ΄μ–΄λ‘œ κ΅¬μ„±λœ μ‹ κ²½λ§μž…λ‹ˆλ‹€.

    λͺ¨λ“  λ ˆμ΄μ–΄κ°€ μ™„μ „μ—°κ²°μΈ΅(Fully Connected, FC)으둜 이루어져 μžˆλ‹€λŠ” 점이 νŠΉμ§•μž…λ‹ˆλ‹€.

    FC λ ˆμ΄μ–΄

    FC λ ˆμ΄μ–΄λž€ 각 λ…Έλ“œκ°€ λ‹€μŒ 측의 λͺ¨λ“  λ…Έλ“œμ™€ μ—°κ²°λœ ꡬ쑰λ₯Ό μ˜λ―Έν•©λ‹ˆλ‹€.
    즉, 이전 λ ˆμ΄μ–΄μ˜ 좜λ ₯을 λ°›μ•„ κ°€μ€‘μΉ˜(Weight)와 κ³±ν•œ ν›„ λ°”μ΄μ–΄μŠ€(Bias)λ₯Ό λ”ν•˜λŠ” 연산이 μ΄λ£¨μ–΄μ§‘λ‹ˆλ‹€.

     

    γ€ŠMLP의 λ™μž‘ 방식>

    MLPμ—μ„œ 데이터가 μ²˜λ¦¬λ˜λŠ” 방식은 λ‹€μŒκ³Ό κ°™μŠ΅λ‹ˆλ‹€:

     

    1. μž…λ ₯ ν–‰λ ¬κ³Ό κ°€μ€‘μΉ˜ ν–‰λ ¬μ˜ κ³±

    • 각 μž…λ ₯ λ…Έλ“œλŠ” ν•΄λ‹Ή κ°€μ€‘μΉ˜λ₯Ό κ³±ν•˜μ—¬ λ‹€μŒ 측으둜 μ „λ‹¬λ©λ‹ˆλ‹€.

    2. λ°”μ΄μ–΄μŠ€ μΆ”κ°€

    • 각 λ‰΄λŸ°μ—λŠ” λ°”μ΄μ–΄μŠ€ 값이 더해지며, μ΄λŠ” λ‰΄λŸ°μ˜ ν™œμ„±ν™” μ—¬λΆ€λ₯Ό μ‘°μ ˆν•˜λŠ” 역할을 ν•©λ‹ˆλ‹€.

    3. ν™œμ„±ν™” ν•¨μˆ˜ 적용

    • λΉ„μ„ ν˜• ν™œμ„±ν™” ν•¨μˆ˜(예: ReLU, Sigmoid, Tanh λ“±)λ₯Ό 톡해 λΉ„μ„ ν˜•μ„±μ„ λΆ€μ—¬ν•©λ‹ˆλ‹€.
    • 이λ₯Ό 톡해 신경망이 λ‹¨μˆœν•œ μ„ ν˜• λͺ¨λΈμ΄ μ•„λ‹Œ λ³΅μž‘ν•œ νŒ¨ν„΄μ„ ν•™μŠ΅ν•  수 μžˆλ„λ‘ λ•μŠ΅λ‹ˆλ‹€.

    μ΄λŸ¬ν•œ 과정이 각 측을 κ±°μΉ˜λ©΄μ„œ 반볡적으둜 μˆ˜ν–‰λ˜λ©°, μ΅œμ’…μ μœΌλ‘œ 좜λ ₯μΈ΅μ—μ„œ μ›ν•˜λŠ” 예츑 값을 μ–»κ²Œ λ©λ‹ˆλ‹€.

     

     

     

    μ™œ λΉ„μ„ ν˜• ν™œμ„±ν™” ν•¨μˆ˜κ°€ ν•„μš”ν• κΉŒ?

     

    MLPλ₯Ό ν–‰λ ¬ μ—°μ‚°μœΌλ‘œ ν‘œν˜„ν•˜λ©΄, μž…λ ₯ 벑터 x에 λŒ€ν•œ ν•¨μˆ˜λ‘œ λ³Ό 수 μžˆμŠ΅λ‹ˆλ‹€.

    즉, MLPλŠ” κ²°κ΅­ xλ₯Ό λ³€ν™˜ν•˜λŠ” ν•¨μˆ˜μ΄λ©°, 이 ν•¨μˆ˜κ°€ μ–Όλ§ˆλ‚˜ λ³΅μž‘ν•œ 관계λ₯Ό ν‘œν˜„ν•  수 μžˆλŠ”μ§€κ°€ μ€‘μš”ν•©λ‹ˆλ‹€.

    그런데, λͺ¨λ“  μΈ΅μ—μ„œ μ„ ν˜• ν™œμ„±ν™” ν•¨μˆ˜λ₯Ό μ‚¬μš©ν•˜λ©΄, 아무리 κΉŠμ€ 측을 μŒ“μ•„λ„ κ²°κ΅­ 단일 FC λ ˆμ΄μ–΄μ™€ λ™μΌν•œ λ³΅μž‘λ„λ₯Ό κ°–κ²Œλ©λ‹ˆλ‹€.

    이λ₯Ό μˆ˜μ‹μœΌλ‘œ μ‚΄νŽ΄λ³΄κ² μŠ΅λ‹ˆλ‹€.

    1. λ‹¨μˆœν•œ μ„ ν˜• λ³€ν™˜μ„ μ—¬λŸ¬ 측에 걸쳐 μ‚¬μš©ν•˜λŠ” 경우

     

    $$f_2(f_1(x)) = f_2(xW_1 + b_1) = (xW_1 + b_1)W_2 + b_2$$

     

    이λ₯Ό μ „κ°œν•˜λ©΄,

    $$(x W_1 + b_1) W_2 + b_2 = x (W_1 W_2) + (b_1 W_2 + b_2)$$

     

    μ—¬κΈ°μ„œ,

    - $( W_1 W_2)$λ₯Ό ν•˜λ‚˜μ˜ μƒˆλ‘œμš΄ κ°€μ€‘μΉ˜ $W$둜 μΉ˜ν™˜

    - $b_1 W_2 + b_2$λ₯Ό μƒˆλ‘œμš΄ λ°”μ΄μ–΄μŠ€ $b$둜 μΉ˜ν™˜ν•˜λ©΄

     

    κ²°κ΅­

    $$xW+b$$

    즉, 아무리 측을 많이 μŒ“μ•„λ„ 결과적으둜 단일 FC λ ˆμ΄μ–΄(μ™„μ „μ—°κ²°μΈ΅)와 λ™μΌν•œ μˆ˜μ‹μ΄ λ‚˜μ˜΅λ‹ˆλ‹€.
    μ΄λŠ” μ‹ κ²½λ§μ˜ κΉŠμ΄κ°€ 의미 μ—†λ‹€λŠ” 것을 μ˜λ―Έν•©λ‹ˆλ‹€.

    → κ²°λ‘ : μ„ ν˜• λ³€ν™˜λ§ŒμœΌλ‘œλŠ” λ„€νŠΈμ›Œν¬λ₯Ό 깊게 λ§Œλ“€λ”λΌλ„ ν•¨μˆ˜κ°€ λ³΅μž‘ν•œ 관계λ₯Ό ν‘œν˜„ν•  수 μ—†λ‹€!

    이 문제λ₯Ό ν•΄κ²°ν•˜λ €λ©΄ 각 μΈ΅μ—μ„œ λΉ„μ„ ν˜•μ„±μ„ μΆ”κ°€ν•΄μ•Ό ν•©λ‹ˆλ‹€.

    즉, μ„ ν˜•μ—°μ‚°μΈ $xW+b$λ₯Ό κ·ΈλŒ€λ‘œ μ‚¬μš©ν•˜λŠ” 것이 μ•„λ‹ˆλΌ, λΉ„μ„ ν˜• ν™œμ„±ν™” ν•¨μˆ˜ $f(x) = \sigma(xW + b)$ λ₯Ό μ μš©ν•΄μ•Ό ν•©λ‹ˆλ‹€.

     

    μ΄λ ‡κ²Œ ν•˜λ©΄, λ„€νŠΈμ›Œν¬λ₯Ό 깊게 λ§Œλ“€μˆ˜λ‘ μΈ΅λ§ˆλ‹€ μƒˆλ‘œμš΄ λΉ„μ„ ν˜• λ³€ν™˜μ΄ μ μš©λ˜μ–΄, λ‹¨μˆœν•œ μ„ ν˜• μ—°μ‚°μœΌλ‘œ ν‘œν˜„ν•  수 μ—†λŠ” λ³΅μž‘ν•œ ν•¨μˆ˜ ν•™μŠ΅μ΄ κ°€λŠ₯ν•΄μ§‘λ‹ˆλ‹€.

     

    πŸ’‘ 즉, ν™œμ„±ν™” ν•¨μˆ˜κ°€ μ—†λ‹€λ©΄ 신경망은 λ‹¨μˆœν•œ μ„ ν˜• λͺ¨λΈμ— λΆˆκ³Όν•˜λ©°, κΉŠμ–΄μ Έλ„ μ˜λ―Έκ°€ μ—†μŠ΅λ‹ˆλ‹€.
    ν•˜μ§€λ§Œ λΉ„μ„ ν˜• ν™œμ„±ν™” ν•¨μˆ˜λ₯Ό μΆ”κ°€ν•˜λ©΄ 신경망이 점점 더 λ³΅μž‘ν•œ 관계λ₯Ό ν•™μŠ΅ν•  수 있게 λ©λ‹ˆλ‹€.

     


     

    μ„ ν˜• vs. λΉ„μ„ ν˜• μ•‘ν‹°λ² μ΄μ…˜μ˜ μ—­ν• 

     

    ν•˜μ§€λ§Œ μ„ ν˜• μ•‘ν‹°λ² μ΄μ…˜μ΄ ν•„μš”μ—†λŠ” μ•‘ν‹°λ² μ΄μ…˜μ€ μ•„λ‹™λ‹ˆλ‹€.

    νšŒκ·€ λ¬Έμ œμ—μ„œλŠ” 좜λ ₯κ°’μ˜ λ²”μœ„κ°€ μ œν•œλ˜μ§€ μ•Šμ•„μ•Ό ν•˜λ―€λ‘œ, λ§ˆμ§€λ§‰ 측에 μ„ ν˜• μ•‘ν‹°λ² μ΄μ…˜μ„ μ‚¬μš©ν•©λ‹ˆλ‹€.

     

    μ„ ν˜• μ•‘ν‹°λ² μ΄μ…˜μ€ 주둜 λ…Έλ“œ μˆ˜κ°€ μ€„μ–΄λ“œλŠ” μΈ΅μ—μ„œ 정보 손싀을 ν”Όν•˜κΈ° μœ„ν•΄ μ‚¬μš©ν•˜κ³ , 

    λΉ„μ„ ν˜• μ•‘ν‹°λ² μ΄μ…˜μ€ λ„€νŠΈμ›Œν¬μ˜ λ³΅μž‘λ„λ₯Ό λ†’μ΄λ―€λ‘œ μž…λ ₯κ³Ό 좜λ ₯ μ‚¬μ΄μ˜ λ³΅μž‘ν•œ 관계λ₯Ό ν‘œν˜„ν•  수 μžˆμ§€λ§Œ 정보 손싀을 μ•ΌκΈ°ν•  수 μžˆμŠ΅λ‹ˆλ‹€.

    λ”°λΌμ„œ, ν˜„λŒ€ λ”₯λŸ¬λ‹ λͺ¨λΈ μ„€κ³„μ—μ„œλŠ” 이 λ‘˜μ˜ μž₯단점을 κ³ λ €ν•˜μ—¬ 적절히 μ‘°ν•©ν•˜μ—¬ μ‚¬μš©ν•©λ‹ˆλ‹€.
    이λ₯Ό 톡해, λ³΅μž‘ν•œ νŒ¨ν„΄μ„ 잘 ν•™μŠ΅ν•˜λ©΄μ„œλ„ μ€‘μš”ν•œ 정보λ₯Ό 보쑴할 수 μžˆλŠ” κ· ν˜• 작힌 λͺ¨λΈμ„ λ§Œλ“€ 수 μžˆμŠ΅λ‹ˆλ‹€.

     


     

    γ€ŠEasy! λ”₯λŸ¬λ‹γ€‹ 은 μ΄ˆλ³΄μžλ„ μ΄ν•΄ν•˜κΈ° 쉽고, μ „κ³΅μžλ„ λ‹€μ‹œ ν•œ 번 κ°œλ…μ„ μ •λ¦¬ν•˜κΈ° 쒋은 μ±…μž…λ‹ˆλ‹€.
    특히 λΉ„μ„ ν˜• ν™œμ„±ν™” ν•¨μˆ˜κ°€ μ‹ κ²½λ§μ˜ 핡심적인 μš”μ†ŒλΌλŠ” 점을 κ°•μ‘°ν•˜λ©°, MLP의 λ™μž‘ 방식과 ν•œκ³„λ₯Ό λͺ…ν™•ν•˜κ²Œ μ§šμ–΄μ€λ‹ˆλ‹€.

    λ”₯λŸ¬λ‹μ„ 처음 λ°°μš°λŠ” 뢄듀이라면, 이 책을 톡해 κΈ°λ³Έ κ°œλ…μ„ ν™•μ‹€νžˆ 닀지고 μ‹€μŠ΅μ„ λ³‘ν–‰ν•˜λ©° ν•™μŠ΅μ„ μ§„ν–‰ν•˜λŠ” 것을 μΆ”μ²œν•©λ‹ˆλ‹€.

     

     

     

     

     

    λ³Έ κ²Œμ‹œκΈ€μ€ ν˜νŽœν•˜μž„μ˜ <Easy! λ”₯λŸ¬λ‹> μ±…μ˜ λ¦¬λ·°μ–΄ ν™œλ™μœΌλ‘œ μž‘μ„±λ˜μ—ˆμŠ΅λ‹ˆλ‹€.
    λ„μ„œ κ΅¬λ§€ λ§ν¬ 1 (ꡐ보문고): https://product.kyobobook.co.kr/detail/S000214848175
    λ„μ„œ κ΅¬λ§€ λ§ν¬ 2 (μΆœνŒμ‚¬ μžμ‚¬λͺ°): https://shorturl.at/yqZpW

     

     

Designed by Tistory.