WIKI


회귀문제와 분류문제(Regression & Classification)

blaire

머신러닝을 통해 예측하고자 하는 값에 따라 회귀분류로 나눌 수 있다.


회귀(Regression)  란?

회귀(regression) 는 예측하고자 하는 타겟값이 실수, 즉 숫자인 경우 이다. 그리고 회귀는 예측 결과가 연속성을 지닌다. 여기서 연속성이란, 말그대로 연속하는 값을 말한다. 예를 들면, 1.2, 1.201, 1.2001 처럼 연속성을 지닌는 것을 뜻한다. 회귀를 통해 손해액, 매출량,거래량, 파산할 확률 등을  예측할 수 있다. 즉, 회귀문제란 실수형 변수를 통해 예측하여 예측 결과값이 연속성을 지니고 있는 경우 회귀문제라고 할 수 있다.


분류(Classification) 란?

분류(classification) 는 예측하고자 하는 타겟값이 범주형 변수인 경우 이다. 회귀와는 다르게 분류는 예측 결과가 연속성을 지니지 않는다. 연속성을 지니는 연속값이 아닌 이산값을 가지고 있다. 여기서 이산값이란, 0과1로 처리할 수 있는 값으로써 연속적이 아닌 단속적인 값을 뜻한다. 분류를 통해 부도 여부(yes/no), 여신 승인 여부, 동물 분류(dog/cat) 등을 예측할 수 있다. 분류의 종류에는 이진분류와 다중분류가 있다. 이진분류(binary Classification)는 Yes/ No처럼 두가지의 답으로 분류하는 것을 뜻한다. 다중분류(multiclass Classification)는 이진분류에서 답의 갯수만 증가한 분류의 형태이다. 즉, 분류문제란 범주형 변수를 통해 예측하여 예측 결과값이 이산값을 지니고 있는 경우 분류문제라고 할 수 있다.