가능도
: 데이터 샘플을 주어진 분포의 파라미터로 얼마나 잘 설명하는지 수치화한 것
신경망과 MLE의 관계
MLE는 확률분포에서 가능도를 제일 크게 만드는, 분포를 잘 설명하는 최적의 파라미터를 찾는 방법
심층신경망 모델 또한 확률 분포 함수 중 하나로 볼 수 있음
즉, 심층신경망의 가중치 파라미터 = 분포를 나타내는 파라미터(분산, 표준편차)
신경망의 출력 = 가중치 파라미터의 변화에 따른 확률 분포