๋ณธ๋ฌธ ๋ฐ”๋กœ๊ฐ€๊ธฐ

๐Ÿ’ซ ์ˆ˜ํ•™

Linear Regression ์„ ํ˜•ํšŒ๊ท€๋ถ„์„


์„œ์šธ๋Œ€ํ•™๊ต ๋„์‹œ ๋ฐ์ดํ„ฐ์‚ฌ์ด์–ธ์Šค ์—ฐ๊ตฌ์†Œ์˜ ๊น€ ์„  ๊ต์ˆ˜๋‹˜ ๋จธ์‹ ๋Ÿฌ๋‹๊ฐ•์˜ ๊ฐ•์˜๋…ธํŠธ.




Linear Regression ์„ ํ˜•ํšŒ๊ท€๋ถ„์„


ํšŒ๊ท€๋ถ„์„ ๋ชจ๋ธ์˜ ๋ชฉ์ : ๋ฐ์ดํ„ฐ ์ƒ˜ํ”Œ์„ ๊ฐ–๊ณ  ์žˆ์ง€ ์•Š์€ ์ง€์ ์—์„œ์˜ ์˜ˆ์ธก

์•„๋ž˜์˜ ๊ทธ๋ž˜ํ”„์—์„œ x๋Š” ์‹ค์ œ ๋ฐ์ดํ„ฐ, ๋นจ๊ฐ•๊ณผ ํŒŒ๋ž‘ ์„ ์€ ์˜ˆ์ธก๊ฐ’์„ ๋‚˜ํƒ€๋‚ธ๋‹ค. (x์ถ•์˜ ํŠน์ • ๊ฐ’์— ๋Œ€ํ•œ ์˜ˆ์ธก๊ฐ’ y๋ฅผ ๋‚˜ํƒ€๋‚ธ ๊ทธ๋ž˜ํ”„)

 


์˜ˆ์ธก ๊ฐ’๋“ค์„ ๋‚˜ํƒ€๋‚ด๋Š” f(x)์™€ g(x)๋Š” ์•„๋ž˜์˜ ์ˆ˜์‹์œผ๋กœ ํ‘œํ˜„ํ•  ์ˆ˜ ์žˆ๋‹ค.

๋‹จ, ์„œ๋กœ ๋‹ค๋ฅธ ฮฒ๊ฐ’์„ ๊ฐ–๊ณ  ์žˆ๋Š” ๊ฒƒ์ด๋‹ค. 



ํ•œ ๋ˆˆ์— ๋ณด๊ธฐ์—  f(x)๊ฐ€ g(x)๋ณด๋‹ค ๋ฐ์ดํ„ฐ๋ฅผ ์ž˜ ์„ค๋ช…ํ•˜๋Š” ๊ฒƒ์œผ๋กœ ๋ณด์ธ๋‹ค.


f(x)๊ฐ€ ๋” ์ ํ•ฉํ•œ ์ด์œ ๋ฅผ ์ •๋Ÿ‰์ ์œผ๋กœ ์„ค๋ช…ํ•˜์ž๋ฉด,

f(x)์˜ ์˜ค์ฐจ์˜ ์ดํ•ฉ์ด g(x)์˜ ์˜ค์ฐจ์˜ ์ดํ•ฉ๋ณด๋‹ค ๋” ์ž‘๊ธฐ ๋•Œ๋ฌธ์ด๋ผ๊ณ  ๋งํ•  ์ˆ˜ ์žˆ๋‹ค.






ํšŒ๊ท€๋ถ„์„์˜ ํ•™์Šต๊ณผ์ •์€ error๋“ค์˜ ํ•ฉ์ด ๊ฐ€์žฅ ์ž‘์€ ํ•จ์ˆ˜๋ฅผ ์ฐพ์•„๊ฐ€๋Š” ๊ณผ์ •์ด๋ผ ํ•  ์ˆ˜ ์žˆ๋‹ค.


error = ์˜ˆ์ธก๊ฐ’๊ณผ ์‹ค์ œ ๋ฐ์ดํ„ฐ๊ฐ„์˜ ๊ฑฐ๋ฆฌ


์˜ค์ฐจ์˜ ์ดํ•ฉ =








SSE (Sum of Squares of Error)


์•ž์„œ ์–ธ๊ธ‰๋œ error^2์˜ ์ดํ•ฉ์€ SSE๋ผ ๋ถˆ๋ฆฐ๋‹ค.




Least squares regression์€ ๊ฐ€์žฅ ๋‚ฎ์€ ๊ฐ’์˜ SSE๊ฐ’์„ ๊ฐ€์ง„ ์„ ๋ถ„์„ ํƒํ•œ๋‹ค.



https://www.gsu.edu/~dscaas/pptdsc/regression








SSR (Sum of Squares Regression)


SSR์€ ๋ฐ์ดํ„ฐ ์ƒ˜ํ”Œ๋“ค์˜ ํ‰๊ท ๊ฐ’๊ณผ ์˜ˆ์ธก๊ฐ’์˜ ์ž”์ฐจ์˜ ์ œ๊ณฑ์„ ๋งํ•œ๋‹ค.




https://www.gsu.edu/~dscaas/pptdsc/regression








SST (The Total Sum of Squares)


SST๋Š” ๋ชจ๋“  ์ฐจ์ด์˜ ํ•ฉ์œผ๋กœ, ๋ถ„์‚ฐ๊ณผ ์—ญํ• ์ด ๋น„์Šทํ•˜๋‹ค.


์‹ค์ œ ๊ฐ’๊ณผ ์˜ˆ์ธก ๊ฐ’์˜ ์ž”์ฐจ๋“ค์˜ ํ•ฉ๊ณผ ์‹ค์ œ ๊ฐ’์˜ ํ‰๊ท ๊ณผ ์˜ˆ์ธก๊ฐ’์˜ ์ž”์ฐจ์˜ ํ•ฉ์„ ๋”ํ•œ ๊ฒƒ์ด๋‹ค.

ํ†ต๊ณ„ํ•™์—์„œ๋Š” ESS(explained sum of squares)๋ผ๊ณ ๋„ ๋ถ€๋ฅธ๋‹ค.


 



์ฆ‰,

์ด๋‹ค.








Coefficient of Determination(๊ฒฐ์ •๊ณ„์ˆ˜)


์ถ”์ •ํ•œ ์„ ํ˜• ๋ชจํ˜•์ด ์ฃผ์–ด์ง„ ์ž๋ฃŒ์— ์–ผ๋งˆ๋‚˜ ์ ํ•ฉํ•œ์ง€ ๋‚˜ํƒ€๋‚ด๋Š” ์ฒ™๋„์ด๋‹ค.


๊ฒฐ์ •๊ณ„์ˆ˜๋Š” ์ƒ๊ด€๊ณ„์ˆ˜๋ฅผ ์ œ๊ณฑํ•˜์—ฌ ๊ตฌํ•  ์ˆ˜ ์žˆ๊ณ ,



SSR์— ์˜ํ•ด ์„ค๋ช…๋˜๋Š” SST์˜ ๋น„์œจ๋กœ๋„ ๊ตฌํ•  ์ˆ˜ ์žˆ๋‹ค.




๊ฒฐ์ •๊ณ„์ˆ˜์˜ ๊ฐ’์€ 0~1์‚ฌ์ด์ด๋ฉฐ, ์ข…์†๋ณ€์ธ๊ณผ ๋…๋ฆฝ๋ณ€์ธ ์‚ฌ์ด์— ์ƒ๊ด€ ๊ด€๊ณ„๊ฐ€ ๋†’์„์ˆ˜๋ก 1์— ๊ฐ€๊นŒ์›Œ์ง„๋‹ค.


๋งŒ์•ฝ ๊ฒฐ์ •๊ณ„์ˆ˜๊ฐ€ 1์ด๋ผ๋ฉด ์ถ”์ •ํ•œ ์„ ํ˜• ๋ชจํ˜• ์œ„์— ๋ชจ๋“  ์ž๋ฃŒ๊ฐ€ ๋ถ„ํฌํ•˜๋Š” ๊ฒƒ์ด๋‹ค.





Prediction Intervals