자료를 공개한 저자 오렐리앙 제롱과 강의자료를 지원한 한빛아카데미에게 진심어린 감사를 전합니다.
머신러닝은 명시적인 프로그래밍 없이 컴퓨터가 학습하는 능력을 갖추게 하는 연구 분야
어떤 작업 T에 대한 컴퓨터 프로그램의 성능을 P로 측정했을 때 경험 E로 인해 성능이 향상되었다면, 이 컴퓨터 프로그램은 작업 T와 성능 측정 P에 대해 경험 E로부터 학습한다고 말한다.
머신러닝 작업 흐름의 전체를 머신러닝 파이프라인 또는 MLOps(Machine Learning Operations, 머신러닝 운영)라 부르며 자동화가 가능함.
다차원 특성을 가진 데이터셋을 2D 또는 3D로 표현하기
시각화를 하기 위해서는 데이터의 특성을 2가지로 줄여야함
데이터가 구성 패턴에 대한 정보 획득 가능
X
를 세모에 더 가깝다고 판단함.X
가 기존에 세모인 샘플과의 유사도가 높기 때문에 세모로 분류.X
를 세모 클래스로 분류데이터를 대표하는 하나의 직선(선형 모델)을 찾기
$$ \text{'삶의만족도'} = \theta_0 + \theta_1 \times \text{'1인당GDP'} $$