자료를 공개한 저자 오렐리앙 제롱과 강의자료를 지원한 한빛아카데미에게 진심어린 감사를 전합니다.
1부
선형 SVM 분류
비선형 SVM 분류
SVM 회귀
SVM 이론
C
이용)하면서 두 클래스 사이의 도로폭을 최대한 넓게 하기C
이용)하면서 지정된 폭의 도로 안에 가능한 많은 샘플 포함하기예제: LinearSVR 활용. epsilon
은 도로폭 결정
from sklearn.svm import LinearSVR
svm_reg = LinearSVR(epsilon=1.5)
epsilon
에 둔감함.예제: SVR + 다항 커널
# SVR + 다항 커널
from sklearn.svm import SVR
svm_poly_reg = SVR(kernel="poly", degree=2, C=100, epsilon=0.1, gamma="scale")
왼편 그래프(C=100) | 오른편 그래프(C=0.01) |
---|---|
규제 보다 약함 | 규제 보다 강함 |
샘플에 덜 민감 | 샘플에 더 민감 |
마진 오류 보다 적게 | 마진 오류 보다 많이 |
LinearSVR
: LinearSVC
의 회귀 버전SVR
: SVC
의 회귀 버전붓꽃 분류. 꽃잎 길이와 너비를 기준으로 버지니카(Iris-Virginica, 초록 삼각형) 품종 여부 판단
위 조건식의 의미는 다음과 같다.
$\zeta^{(i)} > 0$이면 해당 샘플 $\mathbf{x}^{(i)}$에 대해 다음이 성립하여 마진 오류가 될 수 있음.
$$1 - \zeta^{(i)} \le t^{(i)} (\mathbf w^T \mathbf x^{(i)} + b) < 1$$
C
와 마진 폭의 관계 (1부)¶C
와 마진 폭의 관계 (2부)¶