import numpy as np
import pandas as pd

np.set_printoptions(precision=6, suppress=True)
PREVIOUS_MAX_ROWS = pd.options.display.max_rows # 원래 60이 기본.
pd.set_option("max_rows", 20)


from sklearn.datasets import load_boston
X = load_boston()


type(X)


X.keys()


X.data


X.data.shape


boston = X.data


X.feature_names


boston = pd.DataFrame(X.data, columns=X.feature_names)
boston


boston['RM'][100:105] = np.nan


# pass와 None을 각각 적절한 코드와 표현식으로 대체하라.

pass

assert None == 5


# pass와 None을 각각 적절한 코드와 표현식으로 대체하라.

pass 

boston_with_nan = None

assert boston_with_nan.shape == (5, 13)


# pass와 None을 각각 적절한 코드와 표현식으로 대체하라.

pass

boston_without_nan = None

assert boston_without_nan.shape == (501, 13)


# boston_with_nan 데이터프레임에 포함된 모든 결측치를 평균값으로 대체해야 함.
# pass를 적절한 코드로 대체할 것.

pass

# boston_with_nan 데이터프레임에 결측치가 없음을 입증해야 함.
# None 을 적절한 표현식으로 대체할 것.

assert None == False


# pass와 None을 각각 적절한 코드와 표현식으로 대체하라.

pass 

# AGE_Year 특성 추가하기

boston['AGE_Year'] = None


# pass와 None을 각각 적절한 코드와 표현식으로 대체하라.

pass

assert ('AGE' in boston.columns) == False

특성	의미
CRIM	구역별 1인당 범죄율
ZN	25,000 평방 피트 이상의 주거 구역 비율
INDUS	구역별 비 소매 사업 에이커(acre) 비율
CHAS	Charles River 더미 변수(구역이 강 경계에 닿으면 1, 아니면 0)
NOX	산화 질소 농도(1000만분 율)
RM	주택 당 평균 방 수
AGE	소유주가 살고 있는 1940년 이전에 지어진 건물 비율
DIS	보스턴 고용 센터 다섯 곳 까지의 가중 거리
RAD	방사형 고속도로 접근성 지수
TAX	1만달러당 전체 가지 재산 세율
PTRATIO	구역별 학생-교사 비율
B	1000(Bk - 0.63)^2 (Bk 구역별 흑인 비율)
LSTAT	구역별 낮은 지위 인구 비율

4차 과제¶

문제 1 (5점)¶

문제 2 (5점)¶

문제 3 (10점)¶

문제 4 (5점)¶

문제 5 (5점)¶

문제 6 (5점)¶

문제 7 (10점)¶

문제 8 (5점)¶