-
PDA 예측적 데이터 분석카테고리 없음 2024. 1. 8. 20:51
수식화 작업을 통해 앞으로 있을 상황에 대한 예측을 수행하는 시스템을 구축
1) 회귀분석 (Regression Analysis)
-> Prediction 예측: 설명변수 (X, 독립변수, 예측변수, Feature)를 이용해, 목표변수(Y, 반응변수, Label)을 예측
-> Estimation 추정: 회귀계수 (Coefficient) 추정
-> Selection 선별: 여러 설명변수들 중 목표변수에 영향을 끼치는 주 변수를 선택 또는 찾아낼 수 있음
ex) 매출액 = 100 * 연령 + 50 * 방문횟수 + 20
매출액 = 190 * 연령 + 10 * 방문횟수 + 20
불량개수 = 1000 * 온도 + 30 * 습도 + 200 * 강도 + 700
2) 회귀분석 종류
- 단순 선형 회귀 분석 Y = aX1 + 100
- 다중 선형 회귀 분석 Y = aX1 + bX2 + cX3 + .....+ C
- 선형회귀 (Linear Regression)
- 비선형회귀 (Non Linear Regression)
3) 회귀분석 실습하기
- 최소제곱법 (Method of Least Square) -> 경사하강법
- 실제데이터와 회귀선에 의한 예측값의 차이가 가장 줄어드는 방향으로 회귀계수 (a , b) 값을 찾는 방
습도 (y) = a x1(온도) + b