본문 바로가기

회귀분석

통계학 3주차 - 회귀분석 통계적 추정을 하는 이유는 무엇인가? 어떤 모집단을 대상으로 실험이나 조사를 할때, 시간과 비용의 제약이 있어 전수조사를 하기 힘드므로 표본을 뽑아 조사 및 실험을 진행하여 모집단의 확률분포를 추정하는 통계적 추정을 한다. 점추정과 구간추정의 차이를 설명하시오. (구간추정의 경우, 신뢰구간의 정의와 함께 설명하시오) 점추정이란 수치적 추정치를 예측하는 것이다. 구간추정이란 일정 구간안의 최솟값과 최댓값 사이의 값이라고 추정하는 것이다. 대표적인 구간추정 방법은 신뢰구간있다. 신뢰구간은 표본 통계량에서 파생되어 알 수 없는 모집단 모수 값이 포함될 가능성이 있는 값의 범위이다. 독립변수와 종속변수 각각에 대해 예시를 들어 설명하시오. 독립변수란 종속변수를 설명해주는 변수를 말한다. 종속변수란 독립변수에 의.. 더보기
Linear Regression 선형회귀분석 서울대학교 도시 데이터사이언스 연구소의 김 선 교수님 머신러닝강의 강의노트. Linear Regression 선형회귀분석 회귀분석 모델의 목적: 데이터 샘플을 갖고 있지 않은 지점에서의 예측아래의 그래프에서 x는 실제 데이터, 빨강과 파랑 선은 예측값을 나타낸다. (x축의 특정 값에 대한 예측값 y를 나타낸 그래프) 예측 값들을 나타내는 f(x)와 g(x)는 아래의 수식으로 표현할 수 있다.단, 서로 다른 β값을 갖고 있는 것이다. 한 눈에 보기에 f(x)가 g(x)보다 데이터를 잘 설명하는 것으로 보인다. f(x)가 더 적합한 이유를 정량적으로 설명하자면,f(x)의 오차의 총합이 g(x)의 오차의 총합보다 더 작기 때문이라고 말할 수 있다. 회귀분석의 학습과정은 error들의 합이 가장 작은 함수를 찾.. 더보기