4장 신경망 활용: 분류와 회귀

주요 내용

  • 머신러닝 실전 예제: 분류와 회귀
    • 이항 분류
    • 다중 클래스 분류
    • 회귀

4.1 영화 리뷰 분류: 이항 분류

  • 영화 리뷰의 긍정성/부정성 평가 분류
  • IMDB 데이터셋
    • 긍정 리뷰: 25,000 개
    • 부정 리뷰: 25,000 개

4.2 뉴스 기사 분류: 다중 클래스 분류

  • 뉴스 기사의 주제(topic)별 분류. 46개의 주제 활용.
  • 로이터(Reuter) 뉴스 데이터셋
    • 훈련 세트 크기: 8,982
    • 테스트 세트 크기: 2,246

4.3 주택 가격 예측: 회귀

  • 1970년대 중반의 미국 보스턴 시내와 외곽의 총 506개 지역별 중간 주택가격. 즉, 매우 적은 수의 데이터셋임.
  • 지역별 샘플
    • 특성: 총 13 개. 지역별 범죄율, 토지 비율, 재산세율, 학생 대 교사 비율 등.
    • 타깃: 주택가격
  • 참고: 위키독스: 보스턴 주택가격 데이터셋 소개