이 그림을 수식으로 표현하기

- 데이터셋 x : N x n차원 행렬, y : N x m차원 행렬

- 손실함수(argmin) 정의 → 모델의 출력과 실제 정답의 차이가 최소화되도록 하기 위해서
- 이 때, 손실함수는 가중치 파라미터 값의 영향을 받고 가중치 파라미터를 조정해야 손실값이 줄어들 수 있음
- 주로 MSE손실함수 사용

- MSE손실함수 사용했을 때 가중치 파라미터(W,b) 구하는 법

- 가중치파라미터($\theta$)로 구한 손실값을 미분 * 학습률한걸 기존 가중치파라미터 값에 빼기
- 경사하강법 사용한 것임