์์ธ๋ํ๊ต ๋์ ๋ฐ์ดํฐ์ฌ์ด์ธ์ค ์ฐ๊ตฌ์์ ๊น ์ ๊ต์๋ ๋จธ์ ๋ฌ๋๊ฐ์ ๊ฐ์๋ ธํธ.
Linear Regression ์ ํํ๊ท๋ถ์
ํ๊ท๋ถ์ ๋ชจ๋ธ์ ๋ชฉ์ : ๋ฐ์ดํฐ ์ํ์ ๊ฐ๊ณ ์์ง ์์ ์ง์ ์์์ ์์ธก
์๋์ ๊ทธ๋ํ์์ x๋ ์ค์ ๋ฐ์ดํฐ, ๋นจ๊ฐ๊ณผ ํ๋ ์ ์ ์์ธก๊ฐ์ ๋ํ๋ธ๋ค. (x์ถ์ ํน์ ๊ฐ์ ๋ํ ์์ธก๊ฐ y๋ฅผ ๋ํ๋ธ ๊ทธ๋ํ)
์์ธก ๊ฐ๋ค์ ๋ํ๋ด๋ f(x)์ g(x)๋ ์๋์ ์์์ผ๋ก ํํํ ์ ์๋ค.
๋จ, ์๋ก ๋ค๋ฅธ ฮฒ๊ฐ์ ๊ฐ๊ณ ์๋ ๊ฒ์ด๋ค.
ํ ๋์ ๋ณด๊ธฐ์ f(x)๊ฐ g(x)๋ณด๋ค ๋ฐ์ดํฐ๋ฅผ ์ ์ค๋ช ํ๋ ๊ฒ์ผ๋ก ๋ณด์ธ๋ค.
f(x)๊ฐ ๋ ์ ํฉํ ์ด์ ๋ฅผ ์ ๋์ ์ผ๋ก ์ค๋ช ํ์๋ฉด,
f(x)์ ์ค์ฐจ์ ์ดํฉ์ด g(x)์ ์ค์ฐจ์ ์ดํฉ๋ณด๋ค ๋ ์๊ธฐ ๋๋ฌธ์ด๋ผ๊ณ ๋งํ ์ ์๋ค.
ํ๊ท๋ถ์์ ํ์ต๊ณผ์ ์ error๋ค์ ํฉ์ด ๊ฐ์ฅ ์์ ํจ์๋ฅผ ์ฐพ์๊ฐ๋ ๊ณผ์ ์ด๋ผ ํ ์ ์๋ค.
error = ์์ธก๊ฐ๊ณผ ์ค์ ๋ฐ์ดํฐ๊ฐ์ ๊ฑฐ๋ฆฌ
์ค์ฐจ์ ์ดํฉ =
SSE (Sum of Squares of Error)
์์ ์ธ๊ธ๋ error^2์ ์ดํฉ์ SSE๋ผ ๋ถ๋ฆฐ๋ค.
Least squares regression์ ๊ฐ์ฅ ๋ฎ์ ๊ฐ์ SSE๊ฐ์ ๊ฐ์ง ์ ๋ถ์ ํํ๋ค.
https://www.gsu.edu/~dscaas/pptdsc/regression
SSR (Sum of Squares Regression)
SSR์ ๋ฐ์ดํฐ ์ํ๋ค์ ํ๊ท ๊ฐ๊ณผ ์์ธก๊ฐ์ ์์ฐจ์ ์ ๊ณฑ์ ๋งํ๋ค.
https://www.gsu.edu/~dscaas/pptdsc/regression
SST (The Total Sum of Squares)
SST๋ ๋ชจ๋ ์ฐจ์ด์ ํฉ์ผ๋ก, ๋ถ์ฐ๊ณผ ์ญํ ์ด ๋น์ทํ๋ค.
์ค์ ๊ฐ๊ณผ ์์ธก ๊ฐ์ ์์ฐจ๋ค์ ํฉ๊ณผ ์ค์ ๊ฐ์ ํ๊ท ๊ณผ ์์ธก๊ฐ์ ์์ฐจ์ ํฉ์ ๋ํ ๊ฒ์ด๋ค.
ํต๊ณํ์์๋ ESS(explained sum of squares)๋ผ๊ณ ๋ ๋ถ๋ฅธ๋ค.
์ฆ,
์ด๋ค.
Coefficient of Determination(๊ฒฐ์ ๊ณ์)
์ถ์ ํ ์ ํ ๋ชจํ์ด ์ฃผ์ด์ง ์๋ฃ์ ์ผ๋ง๋ ์ ํฉํ์ง ๋ํ๋ด๋ ์ฒ๋์ด๋ค.
๊ฒฐ์ ๊ณ์๋ ์๊ด๊ณ์๋ฅผ ์ ๊ณฑํ์ฌ ๊ตฌํ ์ ์๊ณ ,
SSR์ ์ํด ์ค๋ช ๋๋ SST์ ๋น์จ๋ก๋ ๊ตฌํ ์ ์๋ค.
๊ฒฐ์ ๊ณ์์ ๊ฐ์ 0~1์ฌ์ด์ด๋ฉฐ, ์ข ์๋ณ์ธ๊ณผ ๋ ๋ฆฝ๋ณ์ธ ์ฌ์ด์ ์๊ด ๊ด๊ณ๊ฐ ๋์์๋ก 1์ ๊ฐ๊น์์ง๋ค.
๋ง์ฝ ๊ฒฐ์ ๊ณ์๊ฐ 1์ด๋ผ๋ฉด ์ถ์ ํ ์ ํ ๋ชจํ ์์ ๋ชจ๋ ์๋ฃ๊ฐ ๋ถํฌํ๋ ๊ฒ์ด๋ค.
Prediction Intervals