-
Principal component analysisMathematics/Linear algebra 2023. 5. 29. 21:43๋ฐ์ํ
Principal component analysis (PCA)
์ฃผ์ฑ๋ถ ๋ถ์(Principal Component Analysis, PCA)์ ๊ฐ์ฅ ๋๋ฆฌ ์ฌ์ฉ๋๋ ์ฐจ์ ์ถ์ ๊ธฐ๋ฒ ์ค ํ๋๋ก, ์ ๋ฐ์ดํฐ์ ๋ถํฌ๋ฅผ ์ต๋ํ ๋ณด์กดํ๋ฉด์ ๊ณ ์ฐจ์ ๊ณต๊ฐ์ ๋ฐ์ดํฐ๋ค์ ์ ์ฐจ์ ๊ณต๊ฐ์ผ๋ก ๋ณํํ๋ค.
์ฐจ์์ถ์๋ ์ ๋ฐ์ดํฐ์ ๋ถํฌ๋ฅผ ๊ฐ๋ฅํ ์ ์งํ๋ฉด์ ๋ฐ์ดํฐ์ ์ฐจ์์ ์ค์ด๋ ๊ฒ์ด๋ค.
PCA ๋ ์ฌ๋ฌ ๋ฐ์ดํฐ๋ค์ด ๋ชจ์ฌ ํ๋์ ๋ถํฌ๋ฅผ ์ด๋ฃฐ ๋, ์ด ๋ถํฌ๋ฅผ ๊ฐ์ฅ ์ ์ค๋ช ํ ์ ์๋ ๋ถํฌ์ ์ฑ๋ถ์ ๋ถ์ํด์ฃผ๋ ๋ฐฉ๋ฒ์ด๋ค.
์ฌ๊ธฐ์ ์ฃผ์ฑ๋ถ์ด๋ผ ํจ์ ๊ทธ ๋ฐฉํฅ์ผ๋ก ๋ฐ์ดํฐ๋ค์ ๋ถ์ฐ์ด ๊ฐ์ฅ ํฐ ๋ฐฉํฅ ๋ฒกํฐ๋ฅผ ์๋ฏธํ๋ค.
๋ค์ ๊ทธ๋ฆผ์ 2์ฐจ์ ๋ฐ์ดํฐ์์ PCA๋ฅผ ์ํํ๋ ์๋ฅผ ๋ํ๋ธ๋ค.
https://bradleyboehmke.github.io/HOML/pca.html ์ ๊ทธ๋ฆผ๊ณผ ๊ฐ์ ํ์ํ์ ๋ฐ์ดํฐ ๋ถํฌ๊ฐ ์์ ๋ ๋ฐ์ดํฐ๋ค์ ๋ถ์ฐ(ํฉ์ด์ง ์ ๋)์ด ๊ฐ์ฅ ํฐ ๋ฐฉํฅ ๋ฒกํฐ๋ฅผ First principal component ๋ผ๊ณ ํ๋ค. ๊ทธ๋ฆฌ๊ณ ์ด ๋ฒกํฐ์ ์์ง์ด๋ฉด์ ๊ทธ ๋ค์์ผ๋ก ๋ฐ์ดํฐ๋ค์ ๋ถ์ฐ์ด ๊ฐ์ฅ ํฐ ๋ฐฉํฅ์ Second principal component ๋ผ๊ณ ํ๋ค.
PCA์ ๊ณ์ฐ
2์ฐจ์ ์ขํํ๋ฉด์ ๋์ธ ๋ฐ์ดํฐ 1000๊ฐ์ ๋ํด PCA๋ฅผ ์ํํ๋ค๊ณ ํ์. ์ด๋ ์ฒซ ๋ฒ์งธ ์ฃผ์ฑ๋ถ ๋ฒกํฐ๋ก ์ ์ฌ์ ๋ด๋ฆฐ ๋ฐ์ดํฐ์ ์ขํ ๊ตฌํ๋ ๊ณผ์ ์ ๋ค์๊ณผ ๊ฐ๋ค.
- ๋ฐ์ดํฐ ํ๊ท ๊ณ์ฐ
$$\bar{d}=\frac{1}{N}\sum_{i}^{100}d_{i}$$ - ๋ฐ์ดํฐ์์ ํ๊ท ์ ๋บ ์ขํ ๊ตฌํ๊ธฐ
$$d_{i}=\tilde{d_{i}}-\bar{d_{i}}$$ - Covariance matrix ๊ตฌํ๊ธฐ
$$R_{d}=\frac{1}{N}DD^{T}$$ - Covariance matrix์ ๊ณ ์ ๊ฐ, ๊ณ ์ ๋ฒกํฐ ๊ณ์ฐ
$\textrm{det}(R_{d}-\lambda I)=0$๋ฅผ ๋ง์กฑํ๋ $\lambda$ (๊ณ ์ ๊ฐ) ์ค ๊ฐ์ฅ ํฐ ๊ฐ ์ ํ
$\textrm{Null}(R_{d}-\lambda_{1} I)$ ์ ๊ธฐ์ ๋ฅผ ๊ตฌํ๋ค. ($v_{1}$ ๋ผ๊ณ ํ์.) - ๊ณ ์ ๋ฒกํฐ ์ ๊ทํ
$$q_{1}=\frac{v_{1}}{\sqrt{v_{1}^{T}v_{1}}}$$ - ๋ฐ์ดํฐ ์ขํ๊ฐ์์ ์ ๊ทํ๋ ๊ณ ์ ๋ฒกํฐ๋ก ์ ์ฌ์ ๋ด๋ฆฌ๊ธฐ
$$d_{i}^{T}q_{1}q_{1}$$ - ๋ค์ ํ๊ท ๋ํด์ฃผ๊ธฐ
$$d_{i}^{PCA}=d_{i}^{T}q_{1}q_{1}+\bar{d_{i}}$$
*$\tilde{d_{i}}$: ๋ฐ์ดํฐ์ ์ขํ๊ฐ๋ค
*$D=\left [ \begin{matrix}
d_{1}, & d_{2}, & \cdots & ,d_{n} \\
\end{matrix} \right ]$
์ถ์ฒ:
- http://matrix.skku.ac.kr/math4ai-intro/W12/
- https://ko.wikipedia.org/wiki/%EC%A3%BC%EC%84%B1%EB%B6%84_%EB%B6%84%EC%84%9D
- https://darkpgmr.tistory.com/110
์ฃผ์ฑ๋ถ ๋ถ์ - ์ํค๋ฐฑ๊ณผ, ์ฐ๋ฆฌ ๋ชจ๋์ ๋ฐฑ๊ณผ์ฌ์
์ํค๋ฐฑ๊ณผ, ์ฐ๋ฆฌ ๋ชจ๋์ ๋ฐฑ๊ณผ์ฌ์ . ์ค์ฌ์ ์ ์ขํ๊ฐ(1,3)์ด๊ณ , (0.878, 0.478)๋ฐฉํฅ์ผ๋ก 3, ์ด์ ์์งํ ๋ฐฉํฅ์ผ๋ก 1์ ํ์คํธ์ฐจ๋ฅผ ๊ฐ์ง๋ ๋ค๋ณ๋ ์ ๊ท๋ถํฌ์ ๋ํ ์ฃผ์ฑ๋ถ ๋ถ์. ํ์ดํ์ ๊ธธ์ด๋ ๊ณต๋ถ์ฐ
ko.wikipedia.org
์ฃผ์ฑ๋ถ ๋ถ์
[์ผ๋ฐ์ธ์ ์ํ] K-MOOC ์ธ๊ณต์ง๋ฅ์ ์ํ ๊ธฐ์ด์ํ ์ ๋ฌธ (Introductory Mathematics for Artificial Intelligence) ์ด์๊ตฌ with ์ด์ฌํ, ํจ์ค๋ฏธ, ๋ฐ๊ฒฝ์ V. ์ฃผ
matrix.skku.ac.kr
'Mathematics > Linear algebra' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
Frobenius norm (0) 2023.09.19 Determinant์ ํน์ฑ - eigenvalue๋ค์ ๊ณฑ (0) 2023.05.28 ๊ฐ์ญํ๋ ฌ ์ ๋ฆฌ (0) 2023.05.14 ์ค์นผ๋ผ, ๋ฒกํฐ๋ฅผ ํ๋ ฌ๋ก ๋ฏธ๋ถ (0) 2023.05.03 - ๋ฐ์ดํฐ ํ๊ท ๊ณ์ฐ