: 임의의 노드를 일정 확률로 드롭 → 학습에 참여하지 않도록 함(역전파에서도 제외)

Untitled

1. 학습과 추론 방식의 차이

Untitled

2. 드롭아웃의 구현

: 드롭아웃은 활성화 함수랑 다음 레이어 사이

Untitled

model = nn.Sequential(
    nn.Linear(300, 200),
    nn.LeakyReLU(),
		nn.Dropout(p)
    nn.Linear(200, 100),
    nn.LeakyReLU(),
		nn.Dropout(p)
    nn.Linear(100,50),
    nn.LeakyReLU(),
		nn.Dropout(p)
    nn.Linear(50, 10), #
)
for epoch_idx in range(n_epochs) :
		net.train()
		for iter_idx in range(n_train_iters) :

		net.eval()
		for iter_idx in range(n_valid_iters) :

3. 드롭아웃의 의미와 한계