본문 바로가기
카테고리 없음

R-공부 : Support Vetor Machine

by 데이터 퍼즐 2021. 5. 9.
반응형

서포트벡터머신 중심선 밖의 경계선을 입력, 

중심선과 경계선 사이: margin(마진, 여백이라고 부름)

데이터가 나와있는 부분 :x벡터

중심선에 수직인 벡터:(90도) w벡터

벡터 표현식: 좌표, 데이터(벡터)로 표현

#좌표를 보고 벡터를 생각할 수 있어야 함

 

내적

ㄴ내적을 하는데 정사영이 필요함

 

정사영: 좌표에 90도 위치를 투영함

ㄴ(w벡터의 norm에 코사인)

 

norm: 벡터의 길이

 

* 0<<1(+), -1<<0

ㄴ제약식을 하나로 만들면? 

ㄴ서포트 벡터간 너비(width)가 넓어야 좋음

ㄴ내적*노멀화(벡터를 자신의 길이로 맞춰줌)

 

*최적화-제약조건 하에서 목적함수를 만족해야함

 Lagrangian: 목적함수와 제약식을 한꺼번에 표현

Lagrangian 듀얼함수: 라그랑지안의 최소값, 최적값을 집어 넣은 것(데이터 자신과의 내적)

 

*method=선형(svmLinear), 비선형(svmPoly) 서포트 벡터 머신

*ploynormal

*caret , kernlab, dgree(차수), scale(차수), Cost(비용)

k=커널 ㅇ

 

ex)와인데이터

*선형: 학습>테스트 데이터(간격이 작음_오버피팅 작음)

*비선형: 학습>테스트데이터(간격이 큼_오버피팅 큼)

 

반응형

댓글