상세 컨텐츠

본문 제목

[PYTHON] &[Muchine Learning] 지도학습, 비지도 학습 , 강화 학습 / 분류, 회귀 / 일반화 등 개념 정리

1 a n G u a g e /PYTHON

by 동혼 2019. 8. 31. 16:25

본문

 

 

 

    지도 학습 (Supervised Learning)

 

데이터에 대한 Label(명시적인 답)이 주어진 상태에서 컴퓨터를 학습시키는 방법.

 

분류(Classification)와 회귀(Regression)로 나뉘어진다.

 

• ex / 스팸 메일 분류 , 집 가격 예측 

 

 

 

    비지도 학습 (Unsupervised Learning)

 

데이터에 대한 Label(명시적인 답)이 없는 상태에서 컴퓨터를 학습시키는 방법.

 

데이터의 숨겨진 특징, 구조, 패턴을 파악하는데 사용.

 

데이터를 비슷한 특성끼리 묶는 클러스터링(Clustering)

    차원축소(Dimensionality Reduction)등이 있다.

• ex / 이미지 감색 처리 , 소비자 그룹 발견을 통한 마케팅 , 손 글씨 숫자 인식 

 

 

 

 

    강화 학습 (Reinforcement Learning)

 

지도학습과 비슷하지만 완전한 답(Label)을 제공하지 않는 특징이 있다.

 

기계는 더 많은 보상을 얻을 수 있는 방향으로 행동을 학습

 

주로 게임이나 로봇을 학습시키는데 많이 사용

 

 

 

 

                                                                        

 

 

 

 

    분류 (Classification)    > 정해진 답 중 하나로 예측 

 

미리 정의된 여러 클래스 레이블 중 하나를 예측하는 것.

 

속성 값을 입력, 클래스 값을 출력으로 하는 모델

 

붓꽃(iris)의 세 품종 중 하나로 분류, 암 분류 등.

 

이진분류, 다중 분류 등이 있다.

 

 

 

    회귀 (Regression)       > 연속적인 숫자 중에 하나로 예측 

 

 

연속적인 숫자를 예측하는 것.

 

속성 값을 입력, 연속적인 실수 값을 출력으로 하는 모델

 

어떤 사람의 교육수준, 나이, 주거지를 바탕으로 연간 소득 예측.

 

예측 값의 미묘한 차이가 크게 중요하지 않다.

 

•예상 출력 값 사이에 연속성이 있다면 회귀문제이다.

 

 

 

                                                                        

 

 

    일반화 

 

• 모델이 처음보는 데이터에 대해 정확하게 예측할 수 있는 것.

 

 

    과대적합       

 

너무 상세하고 복잡한 모델링을 하여 훈련데이터에만 과도하게 정확히 동작하는 모델.

 

 

    과소적합       

 

모델링을 너무 간단하게 하여 성능이 제대로 나오지 않는 모델.

 

 

 

 

    과대적합 , 과소적합 해결 방법 

 

 

•다양한 훈련데이터를 훈련시킨다.

 

•데이터 양을 늘린다 ( 하지만 편중된 데이터를 많이 모으는 것은 도움이 되지 않음 )

 

규제(Regularization)을 통해 모델의 복잡도를 적정선으로 설정한다.

 

 

 

                                                                        

 

 

 

 

 

 

 

 

 

 

 

관련글 더보기

댓글 영역