-
λ₯λ¬λ μ λ¬Έμ μΆμ²: νννμμ γEasy! λ₯λ¬λγ 리뷰기ν 2025. 1. 28. 21:19λ°μν
μμ¦ AI λ₯λ¬λ λΆμΌμ κ΄μ¬μ κ°λ λΆλ€μ΄ λκ³ μμ§λ§, μ΄λμλΆν° μμν΄μΌ ν μ§ λ§λ§ν΄νμλ κ²½μ°κ° λ§μ΅λλ€.
μλ§μ λ₯λ¬λ μ± μ€μμ μ΄λ³΄μμ λλμ΄λ₯Ό λ§μΆλ©΄μλ μ 곡μμ κΉμ΄κΉμ§ μ΄ν΄μμΌμ£Όλ μ± μ μ°ΎκΈ°λ μ½μ§ μμλ°μ,
κ·Έλ° μ μμ, μ΅κ·Ό μ½μ νννμμ γEasy! λ₯λ¬λγ μ μ΄λ° κ³ λ―Όμ λ¨λ²μ ν΄κ²°ν΄μ£Όλ μ± μ΄μμ΅λλ€.
μ΄ μ± μ μ μμΈ νννμ λμ μ΄λ―Έ λ₯λ¬λ κ°μλ‘ μ λͺ ν λ§νΌ, μ± μμλ 볡μ‘ν κ°λ μ μ§κ΄μ μΌλ‘ νμ΄λ΄λ λ₯λ ₯μ΄ λ보μ λλ€.
μ΄λ €μ΄ μμμ λμ΄ν기보λ€λ, μ½κ³ λͺ νν λΉμ μ κ·Έλ¦Όμ νμ©ν΄ λ μκ° κ°λ μ μ΄ν΄νλλ‘ λλ μ μ΄ μΈμμ μ΄μμ΅λλ€.
κΈ°μ΄ κ°λ λΆν° μ΅μ AI λͺ¨λΈκΉμ§ μμ°μ€λ½κ² μ°κ²°λλ νλ¦ λλΆμ, λ₯λ¬λμ μ²μ λ°°μ°λ μ¬λλΏλ§ μλλΌ, κΈ°μ‘΄μ κ°λ μ μ 리νκ³ μΆμ μ 곡μμκ²λ μ μ΅ν μ± μ΄λΌλ μκ°μ΄ λ€μμ΅λλ€.
μ€λμ μ 리: γEasy! λ₯λ¬λγ μ±ν° 3
μ±ν° 3μμλ MLP(Multi-Layer Perceptron), μμ ν(Backpropagation) λ± λ₯λ¬λμ λ΄λΆ ν΅μ¬ μμλ€μ λν μ€λͺ μ΄ λμ΅λλ€.
MLP
MLPλ μ λ ₯(Input) λ μ΄μ΄, μΆλ ₯(Output) λ μ΄μ΄, κ·Έλ¦¬κ³ νλ μ΄μμ νλ (Hidden) λ μ΄μ΄λ‘ ꡬμ±λ μ κ²½λ§μ λλ€.
λͺ¨λ λ μ΄μ΄κ° μμ μ°κ²°μΈ΅(Fully Connected, FC)μΌλ‘ μ΄λ£¨μ΄μ Έ μλ€λ μ μ΄ νΉμ§μ λλ€.
FC λ μ΄μ΄
FC λ μ΄μ΄λ κ° λ Έλκ° λ€μ μΈ΅μ λͺ¨λ λ Έλμ μ°κ²°λ ꡬ쑰λ₯Ό μλ―Έν©λλ€.
μ¦, μ΄μ λ μ΄μ΄μ μΆλ ₯μ λ°μ κ°μ€μΉ(Weight)μ κ³±ν ν λ°μ΄μ΄μ€(Bias)λ₯Ό λνλ μ°μ°μ΄ μ΄λ£¨μ΄μ§λλ€.γMLPμ λμ λ°©μ>
MLPμμ λ°μ΄ν°κ° μ²λ¦¬λλ λ°©μμ λ€μκ³Ό κ°μ΅λλ€:
1. μ λ ₯ νλ ¬κ³Ό κ°μ€μΉ νλ ¬μ κ³±
- κ° μ λ ₯ λ Έλλ ν΄λΉ κ°μ€μΉλ₯Ό κ³±νμ¬ λ€μ μΈ΅μΌλ‘ μ λ¬λ©λλ€.
2. λ°μ΄μ΄μ€ μΆκ°
- κ° λ΄λ°μλ λ°μ΄μ΄μ€ κ°μ΄ λν΄μ§λ©°, μ΄λ λ΄λ°μ νμ±ν μ¬λΆλ₯Ό μ‘°μ νλ μν μ ν©λλ€.
3. νμ±ν ν¨μ μ μ©
- λΉμ ν νμ±ν ν¨μ(μ: ReLU, Sigmoid, Tanh λ±)λ₯Ό ν΅ν΄ λΉμ νμ±μ λΆμ¬ν©λλ€.
- μ΄λ₯Ό ν΅ν΄ μ κ²½λ§μ΄ λ¨μν μ ν λͺ¨λΈμ΄ μλ 볡μ‘ν ν¨ν΄μ νμ΅ν μ μλλ‘ λμ΅λλ€.
μ΄λ¬ν κ³Όμ μ΄ κ° μΈ΅μ κ±°μΉλ©΄μ λ°λ³΅μ μΌλ‘ μνλλ©°, μ΅μ’ μ μΌλ‘ μΆλ ₯μΈ΅μμ μνλ μμΈ‘ κ°μ μ»κ² λ©λλ€.
μ λΉμ ν νμ±ν ν¨μκ° νμν κΉ?
MLPλ₯Ό νλ ¬ μ°μ°μΌλ‘ νννλ©΄, μ λ ₯ λ²‘ν° xμ λν ν¨μλ‘ λ³Ό μ μμ΅λλ€.
μ¦, MLPλ κ²°κ΅ xλ₯Ό λ³ννλ ν¨μμ΄λ©°, μ΄ ν¨μκ° μΌλ§λ 볡μ‘ν κ΄κ³λ₯Ό ννν μ μλμ§κ° μ€μν©λλ€.
κ·Έλ°λ°, λͺ¨λ μΈ΅μμ μ ν νμ±ν ν¨μλ₯Ό μ¬μ©νλ©΄, μ무리 κΉμ μΈ΅μ μμλ κ²°κ΅ λ¨μΌ FC λ μ΄μ΄μ λμΌν 볡μ‘λλ₯Ό κ°κ²λ©λλ€.
μ΄λ₯Ό μμμΌλ‘ μ΄ν΄λ³΄κ² μ΅λλ€.
1. λ¨μν μ ν λ³νμ μ¬λ¬ μΈ΅μ κ±Έμ³ μ¬μ©νλ κ²½μ°
$$f_2(f_1(x)) = f_2(xW_1 + b_1) = (xW_1 + b_1)W_2 + b_2$$
μ΄λ₯Ό μ κ°νλ©΄,
$$(x W_1 + b_1) W_2 + b_2 = x (W_1 W_2) + (b_1 W_2 + b_2)$$
μ¬κΈ°μ,
- $( W_1 W_2)$λ₯Ό νλμ μλ‘μ΄ κ°μ€μΉ $W$λ‘ μΉν
- $b_1 W_2 + b_2$λ₯Ό μλ‘μ΄ λ°μ΄μ΄μ€ $b$λ‘ μΉννλ©΄
κ²°κ΅
$$xW+b$$
μ¦, μ무리 μΈ΅μ λ§μ΄ μμλ κ²°κ³Όμ μΌλ‘ λ¨μΌ FC λ μ΄μ΄(μμ μ°κ²°μΈ΅)μ λμΌν μμμ΄ λμ΅λλ€.
μ΄λ μ κ²½λ§μ κΉμ΄κ° μλ―Έ μλ€λ κ²μ μλ―Έν©λλ€.→ κ²°λ‘ : μ ν λ³νλ§μΌλ‘λ λ€νΈμν¬λ₯Ό κΉκ² λ§λ€λλΌλ ν¨μκ° λ³΅μ‘ν κ΄κ³λ₯Ό ννν μ μλ€!
μ΄ λ¬Έμ λ₯Ό ν΄κ²°νλ €λ©΄ κ° μΈ΅μμ λΉμ νμ±μ μΆκ°ν΄μΌ ν©λλ€.
μ¦, μ νμ°μ°μΈ $xW+b$λ₯Ό κ·Έλλ‘ μ¬μ©νλ κ²μ΄ μλλΌ, λΉμ ν νμ±ν ν¨μ $f(x) = \sigma(xW + b)$ λ₯Ό μ μ©ν΄μΌ ν©λλ€.
μ΄λ κ² νλ©΄, λ€νΈμν¬λ₯Ό κΉκ² λ§λ€μλ‘ μΈ΅λ§λ€ μλ‘μ΄ λΉμ ν λ³νμ΄ μ μ©λμ΄, λ¨μν μ ν μ°μ°μΌλ‘ ννν μ μλ 볡μ‘ν ν¨μ νμ΅μ΄ κ°λ₯ν΄μ§λλ€.
π‘ μ¦, νμ±ν ν¨μκ° μλ€λ©΄ μ κ²½λ§μ λ¨μν μ ν λͺ¨λΈμ λΆκ³Όνλ©°, κΉμ΄μ Έλ μλ―Έκ° μμ΅λλ€.
νμ§λ§ λΉμ ν νμ±ν ν¨μλ₯Ό μΆκ°νλ©΄ μ κ²½λ§μ΄ μ μ λ 볡μ‘ν κ΄κ³λ₯Ό νμ΅ν μ μκ² λ©λλ€.
μ ν vs. λΉμ ν μ‘ν°λ² μ΄μ μ μν
νμ§λ§ μ ν μ‘ν°λ² μ΄μ μ΄ νμμλ μ‘ν°λ² μ΄μ μ μλλλ€.
νκ· λ¬Έμ μμλ μΆλ ₯κ°μ λ²μκ° μ νλμ§ μμμΌ νλ―λ‘, λ§μ§λ§ μΈ΅μ μ ν μ‘ν°λ² μ΄μ μ μ¬μ©ν©λλ€.
μ ν μ‘ν°λ² μ΄μ μ μ£Όλ‘ λ Έλ μκ° μ€μ΄λλ μΈ΅μμ μ 보 μμ€μ νΌνκΈ° μν΄ μ¬μ©νκ³ ,
λΉμ ν μ‘ν°λ² μ΄μ μ λ€νΈμν¬μ 볡μ‘λλ₯Ό λμ΄λ―λ‘ μ λ ₯κ³Ό μΆλ ₯ μ¬μ΄μ 볡μ‘ν κ΄κ³λ₯Ό ννν μ μμ§λ§ μ 보 μμ€μ μΌκΈ°ν μ μμ΅λλ€.
λ°λΌμ, νλ λ₯λ¬λ λͺ¨λΈ μ€κ³μμλ μ΄ λμ μ₯λ¨μ μ κ³ λ €νμ¬ μ μ ν μ‘°ν©νμ¬ μ¬μ©ν©λλ€.
μ΄λ₯Ό ν΅ν΄, 볡μ‘ν ν¨ν΄μ μ νμ΅νλ©΄μλ μ€μν μ 보λ₯Ό 보쑴ν μ μλ κ· ν μ‘ν λͺ¨λΈμ λ§λ€ μ μμ΅λλ€.
γEasy! λ₯λ¬λγ μ μ΄λ³΄μλ μ΄ν΄νκΈ° μ½κ³ , μ 곡μλ λ€μ ν λ² κ°λ μ μ 리νκΈ° μ’μ μ± μ λλ€.
νΉν λΉμ ν νμ±ν ν¨μκ° μ κ²½λ§μ ν΅μ¬μ μΈ μμλΌλ μ μ κ°μ‘°νλ©°, MLPμ λμ λ°©μκ³Ό νκ³λ₯Ό λͺ ννκ² μ§μ΄μ€λλ€.λ₯λ¬λμ μ²μ λ°°μ°λ λΆλ€μ΄λΌλ©΄, μ΄ μ± μ ν΅ν΄ κΈ°λ³Έ κ°λ μ νμ€ν λ€μ§κ³ μ€μ΅μ λ³ννλ©° νμ΅μ μ§ννλ κ²μ μΆμ²ν©λλ€.
λ³Έ κ²μκΈμ νννμμ <Easy! λ₯λ¬λ> μ± μ λ¦¬λ·°μ΄ νλμΌλ‘ μμ±λμμ΅λλ€.
λμ ꡬ맀 λ§ν¬ 1 (κ΅λ³΄λ¬Έκ³ ): https://product.kyobobook.co.kr/detail/S000214848175
λμ ꡬ맀 λ§ν¬ 2 (μΆνμ¬ μμ¬λͺ°): https://shorturl.at/yqZpW