Q. 왜 사용하는가?

A.

앞서 설명한대로 로지스틱 회귀는 분류문제에 가깝다. 예측하고자 하는 범위도 yes나 no인 이진(두개)카테고리다.

그러면 어떤 값을 기준으로 이 값을 넘거나, 넘지 못하면 yes나 no라고 분류할 수 있게 된다.

이때, 시그모이드의 출력값을 활용할 수 있는 이유는 분류문제를 확률 문제로 접근할 수 있기 때문이다

그러니까, 샘플 x가 주어졌을 때 출력은 x가 참 클래스에 속할 것인가?에 대한 확률값을 표현한 것으로 볼 수 있다.

수식은 다음과 같다,

Untitled

이렇듯 이진분류에 적합한 함수(출력이 0이나 1 아님 -1이나 1사이, 즉, 어떤 기준을 두고 두개의 범주로 구분할 수 있는 출력값을 갖는 함수)가 로지스틱 회귀에 필요하다

그렇기에 선형회귀에서 썼던 MSE는 더이상 못쓰게 됨!

이진 크로스엔트로피 손실함수(BCE)