1. 데이터 준비

  1. 필요한 라이브러리와 데이터셋 로딩
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt

from sklearn.preprocessing import StandardScaler
from sklearn.datasets import fetch_california_housing
  1. 캘리포니아 데이터셋 확인하기
california = fetch_california_housing()

df = pd.DataFrame(california.data, columns = california.feature_names)
df["TARGET"] = california.target
df.tail()
  1. 데이터 분포 파악
# 데이터가 너무 많으므로 1000개만 임의 추출해서 pairplot그리기

sns.pairplot(df.sample(1000))
plt. show()
  1. 데이터 정제하기
scaler = StandardScaler()
scaler.fit(df.values[:,:-1])
df.values[:,:-1] = scaler.transform(df.values[:,:-1])

sns.pairplot(df.sample(1000))
plt.show()

2. 학습 코드 구현

  1. 필요한 모듈 불러오기
import torch
import torch.nn as nn
import torch.nn.functional as F
import torch.optim as optim