<파이썬 라이브러리를 활용한 데이터 분석(2판)>의 소스코드를 담고 있는 주피터 노트북과 <밑바닥부터 시작하는 데이터 과학(2판)>의 소스코드를 기본 틀로 삼아 파이썬 언어를 이용한 데이터 분석 기초 강의노트 모음집을 제공합니다.
감사의 글
소중한 소스코드를 공개한 웨스 맥키니(Wes McKinney)와 조엘 그루스(Joel Grus)에게 진심어린 감사를 전합니다.
목차
-
강의 목표 및 주요 내용 [html]
- 파이썬 프로그래밍 기초 1부
- 파이썬 프로그래밍 기초 2부
- 넘파이(numpy)
- 선형대수 기초 밑바닥부터: 벡터와 행렬 [html], [colab]
- 통계 기초 밑바닥부터: 중심경향성, 산포도, 상관관계 [html], [colab]
- 판다스(pandas)
- 그래프와 시각화
- 머신러닝 맛보기
실습 과제
- 실습 과제 1: 파이썬 기초 문법 [html], [colab]
- 실습 과제 2: 이미지 크기 조절 [html], [colab]
- 실습 과제 3: 넘파이 기초 활용 [html], [colab]
- 실습 과제 4: 판다스 기초 활용 [html], [colab]
- 실습 과제 5: 선형대수 기초(넘파이와 판다스 활용) [html], [colab]
- …
링크 활용법
- html 버전: 읽기 전용 주피터 노트북
- colab 버전: 구글 코랩에서 직접 실행 가능한 주피터 노트북
권장 사항
파이썬 프로그래밍이 처음이거나 기초가 약하다면 아래 파이썬 데이터 분석 프로그래밍 왕기초 내용을 먼저 읽기를 추천합니다.
- Elements of Data Science, Allen B. Downey
- 파이썬 데이터 과학 입문
프로그래밍 환경
아래에서 소개하는 온라인 또는 오프라인 환경설정을 선택해서 사용할 수 있습니다. 온라인 활용법은 아무런 설치과정 없이 바로 실습할 수 있는 환경을, 반면에 오프라인 환경설정은 보다 편리하며 개별화된 프로그래밍 환경을 제공합니다.
온라인
추천 활용법: 장 별로 지정된 구글 코랩 노트북 활용
주의사항: 온라인 상에서 작업한 내용은 저장되지 않으며, 따라서 먼저 자신의 계정으로 사본을 만든 후에 수정 및 실행해야 함.
구글 코랩 사용법은 아래 동영상을 참조하세요.
오프라인
추천 활용법: 프로젝트 리포지토리를 복제한 후에 아나콘다의 주피터 노트북 활용.
참고 자료
- 넘파이(numpy) 연습문제
- 판다스(pandas) 실전 활용법 소개 동영상 모음집
- 유튜브: Data analysis in Python with Pandas, 자동번역 한글자막 수준 매우 우수: 설정 => 자막 => 자동 번역 => 한국어
- 코드