Linear Classification, Logistic Regression

728x90

[ Linear Classification ]

- training set의 output(target) variable이 범주 형태로 주어지는 것.

- linear classification

- 일차 함수, 즉 직선 형태의 boundary를 이용해 data를 분류하는 model

ex) 위의 binary classification 같은 경우, 두 class data의 범주를 나누어주는 경계인 'Decision boundary'를 찾는것이 목표.

ex) Decision boundary를 알고 있다면, test data 'x'에 따른 target class를 예측할 수 있다.

- Threshold function (문턱 함수)를 사용.

- step function 형태

- Linear Classification, Perceptron

- Perceptron

- Outlier가 있을 경우는 weight가 수렴이 잘 안된다.

- Linearly separable한 경우에만 수렴한다.

[ Logistic Regression ]

- Linear Classification와 달리, 'nonseparable'한 경우에서도 잘 수렴하게 하기 위해 사용

- logistic function 사용

Logistic regression의 손실 함수
- log loss 사용
  - Target class label이 1일 때 : predict class label이 1일 확률을 1에 가깝게 해주는 것.
  - Target class label이 0일 때 : predict class label이 1일 확률을 0에 가깝게 해주는 것.
  - Max함수를 log-sum-exponential로 추정해 변환한다.
- MSE를 사용하지 않는 이유 : logistic function이 nonlinear한 형태이기 때문에 MSE를 사용하면 손실함수 형태가 비이상적임. (아래로 볼록 형태 X)

[순서]

Why? 뉴런이 하는 일이 binary classification과 비슷하기 때문.

728x90

Unsupervised Learning - Clustering 부분 발표 자료 (0)	2021.11.21
ML Basic 정리 (0)	2021.11.20
쏘카 Socar x 멋사 AI 엔지니어 육성 부트캠프 참여! [1주차, 2주차 1/2] (2)	2021.10.22

댓글