- 어떤 대상을 설명하고자 할 때 다른 대상과 확연히 구분할 수 있는 점
- 모델은 원하는 출력 결과를 도출하는 입력 샘플을 다른 샘플들과 구분해낼 수 있는 능력이 필요함
- 그러므로 데이터의 샘플을 잘 나타내는 특징을 추출하고 학습할 수 있어야 함.
Ex.
사람을 잘 나타낼 수 있는 특징들
연속 값 : 나이, 키, 몸무게, 소득
카테고리 : 성별, 직업, 거주지, 출신 학교/학과
Ex.
MNIST에서 숫자를 구분할 때 특징들
곧은선과 휘어진 선이 얼만큼 있는가?
곧은 선과 휘어진 선들이 서로 어떻게 이어져 있는가?
특정 위치의 선이 얼마나 굵은가?
특정 위치의 선이 얼마나 기울어져 있는가?
1. 특징 추출 방법 : 머신러닝 VS 딥러닝
- 전통적인 방식의 머신러닝에서는 주로 사람이 직접 가정을 세우고 특징을 추출함
- 이를 위해 데이터를 면밀하게 분석
- 가정에 따라 전처리를 수행해 특징을 추출
- 모델에 넣어 학습
- 단, 모델의 동작 및 결과 해석을 주관적으로 하기 쉬움
- 딥러닝은 데이터를 일단 넣고 신경망 모델이 직접 특징을 파악하고 추출하여 분류, 회귀 등의 작업을 수행
- 해석하기 어렵다
- 문제가 생겼을 경우 원인 분석이 어렵다