ํ๊ท๋ถ์
- ์ง๋ ํ์ต
๋ชฉํ: ์ค์ ๋ฒ์์
- ํด์๋ ฅ์ด ์ข๋ค
- ํ๋ จ ๋ฐ์ดํฐ ๊ด์ธก๋๊ธฐ ์ ์ ๊ณ ์
์ฐจ์์ ์ ์ฃผ ๋ฌธ์ ์์
bias varience trade off
์์ธก trad off ์ถ๋ก - ISIR
์์ธก ์ ํ๋๊ฐ ๋์ผ๋ฉด ( ์ ์ฐ์ฑflexivity์ด ๋์์) ๋ชจ๋ธ์ ํด์ํ ์ ์๋ ํด์๋ ฅ์ด ๋ฎ์์ง๋ ๊ด๊ณ
๊ธฐ์ ํจ์ basis function ฯ(⋅)
- ๊ณต๊ฐ์ ๋ฐ๊ฟ์ค๋ค?
- ํ์ฑํ ํจ์๊ฐ์ ๋ถ์ฐ์ค๋ช ์ด ๋ฌ๋ ค์๋๊ฑฐ๊ฐ์๋ฐ(์๋); ๊ธฐ์ ํจ์์ ๋์ ์ผ๋ก ๊ธฐ์กด์๋ x์ ๋ํ ์ ํ ์์ด์๋ y(x, w) ํจ์๊ฐ x์ ๋ํ ๋น์ ํ ํจ์๊ฐ ๋ ์๋ ์๋ค.
- ๊ธฐ์ ํจ์์ PCA๋ฅผ ๋ฃ์ ์๋ ์๊ณ
- ์ ํํ๊ท์ ์ ํ์ด๋ผ๋๊ฒ W์ ๋ํด ์ ํ์ด๋ผ๋ ๊ฒ์ด๊ณ , x์ ๋ํด์๋ ์ ํ์ด ์๋์ฌ๋ ๋๋ค.
- ๊ธฐ์ ํจ์ ์ ์ฒ๋ฆฌํด์ฃผ๋๊ฑฐ๊ฐ๋ค normalizeํ๊ฑฐ๋ ๊ทธ๋ฌ๋๊ฑฐ
- CNN + ๋ง์ง๋ง์ linear func์ผ๋ก ๋ถ๋ฅํด์ฃผ๋ ๋ชจ๋ธ์ ์๊ฐํด๋ดค์๋, CNN๋ถ๋ถ == feature extractor == ฯ(⋅) ๋ก ๋ณผ ์ ์์.
- ๊ธฐ์ ํจ์๋ฅผ ์ด์ฉํด์ ์ปค๋ธํผํ ํ๋ ๋ฐฉ์
์ต๋ ๊ฐ๋ฅ๋ == ์ต์ ์ ๊ณฑ๋ฒ
- ํํ๊ฐ ๊ฐ์ ์ฆ๋ช ๋ณด๊ธฐ
์ต์ ์ ๊ณฑ๋ฒ์ ๊ธฐํํ์ ์๋ฏธ
Least squares๋ฅผ ํ๋ ์ด์
์ค์ธก๊ฐ t์ ๊ฐ์ฅ ๋น์ทํ y๋ฅผ ํฌ์?
t ํ๊ฒ ๋ณ์๋ฅผ ์ชผ๊ฐ๋ ๊ฑฐ
ํ๋๋ ์ง๊ตํ๊ณ ํ๋๋ spanํ ๊ณต๊ฐ์์ t์ ๊ฐ์ฅ ๊ฐ๊น์ด y
ํด๊ฐ ์์ผ๋ฉด ์ง๊ตํ ๋ฒกํฐ๋ค๋ก ์ด๋ค์ง ๊ณต๊ฐ์ผ๋ก ๋ค์ด๊ฐ๋๋ฐ
(ํด๊ฐ ์๊ธฐ ๋๋ฌธ์)์ ์ ๋ฒ์ด๋ ์๊ธฐ ๋๋ฌธ์ t์ ๊ฐ๊น์ด ์ต์ ์์ ์ ์(๊ทผ์ฌํด) ์ฐพ์๋ ค๋ฉด ๊ทธ ๊ณต๊ฐ์์ ์ง๊ตํ ์ ์ ์ฐพ๋๊ฑฐ
๊ทธ ๊ณต๊ฐ์์ ์์ง์ผ๋ก ์ฌ๋ผ๊ฐ ์ ์ด ๊ฐ์ฅ ๊ฐ๊น์
basis๊ฐ ์ด๋ฃจ๊ณ ์๋ ๋ฒกํฐ์คํ์ด์ค์ target๋ค์ ํํํ๊ณ ์ถ์ด์ ํฌ์์ ํ๋๊ฑฐ์ผ?
์ญํ๋ ฌ ๊ณ์ฐ ๋น์ธ์ ๋ฐ์ดํฐ๊ฐ ๋ง์์ง๋ฉด, ๊ณ์ฐํ ์๊ฐ ํ๋ค์ด์ง๋ค
>>>
์ํ์ค ํ์ต
์ ์์ฐจ์ ํ์ต์ ํ๋๊ฐ?
(1. ๊ทธ๋ฆฌ๋ ์์น
- ๊ฐ๋ฅํ x ๊ฐ์ ์ ๋ถ ๋ฃ๊ณ ์ต์ ์ parameter๋ฅผ ์ฐพ๋๋ค. ( ๋๋ฌด ๊ณ์ฐ๋์ด ํผ)
- ์๋ง์ ๊ฐ๋ฅ์ฑ์ ๋ชจ๋ ๊ณ ๋ คํด์ผ ํ๊ธฐ ๋๋ฌธ์ ๊ณ์ฐ๋์ด ์๋น.)
2. ์์น์ ์ต์ ํ
- ์ํ์ฐฉ์ค ๋ฐ๋ณต์ผ๋ก ์ต์ ์ parameter๋ฅผ ์ฐพ๋๋ค.
- ์์ฐจ์ ๊ฒฝ์ฌํ๊ฐ๋ฒ, ํ๋ฅ ์ ๊ฒฝ์ฌํ๊ฐ๋ฒ SGD
- ํ์ต๋ฅ ์ ๋นํ๊ฒ ์ค์ผํจ. ๋๋ฌด ํฌ๋ฉด ์ง๋.
์ ์นํ๊ฐ ํฌํจ๋ ์ต์ ์ ๊ณฑ๋ฒ
Bias-Variance Decomposition
์ถ์๊ฐ๋ฅ ์ค์ฐจ
- ๊ด๊ณ์ ๋งค๊ฐ๋ณ์ ์ด๋ป๊ฒ ์ค์ ํ๋์ง์ ๋ฐ๋ผ y(x)์ ๋ฐ๋ผ ๋ณ๋๋๋ ์ค์ฐจ
์ถ์ ๋ถ๊ฐ๋ฅ ์ค์ฐจ
- ๋ฐ์ดํฐ ์์ฒด์ ๋ด์ฌ์ ์ค๋ฅ๋ก ์ธํ ์ค์ฐจ (์ด์์ ์ผ๋ก ๋ชจ๋ธ๋ง ํ์ด๋ ๋์ค๋ ์ค์ฐจ)
์ ์ฐํ ๋ชจ๋ธ ํธํฅ ํฌ๊ณ ๋ถ์ฐ ์์
์๊ฒฉํ ๋ชจ๋ธ์ ํธํฅ ์๊ณ ๋ถ์ฐ ํผ