본문 바로가기
일기

0806 이해하기

by 눈표범  2021. 8. 6.

Supervised Learning : 지도 학습
- Regression 회귀 -> Recursion(재귀)와는 다르다.
- Classification 분류 -> 어떤 경향성(답)을 찾는 것

Unsupervised Learning : 비지도 학습
- Clustering 군집화 -> 기준을 세워서 그에 맞는 애들끼리 묶는 것

즉, 위에서 예를 들었던 음악 장르 예측은 ‘분류’ 과제가 된다. 분류는 특히 이미지 처리 분야에서 정말 활발하게 활용된다.


의사결정 나무(Decision Tree) 쉽게 이해하기
-지니 불순도 (Gini Impurity)
-정보 획득량 (Information Gain)
-재귀적(Recursive)

재귀(recursive) 알고리즘:
기준에 따라 나누기 반복적으로 적용->최적의 트리

의사결정나무의 한계
한계 1.
greedy =>여러 경우 중 하나를 결정해야 할 때마다 그 순간에 최적이라고 생각되는 것을 선택해나가는 방식으로 진행해서 최종적인 해답에 도달하는 일명 ‘탐욕 알고리즘‘.

한계 2.
오버피팅 -> 트리의 구조가 훈련 데이터에 너무 의존적=> 현실의 데이터를 정확하게 나타내지 못함.
일반적으로 나무가 커질수록 => 학습 데이터에 알맞게 모델이 만들어짐 => '현실' 데이터로 일반화(generalization)하기 어려워지는 경향이 있다.
->이걸 해결하려면 결국 나무를 잘라내서 크기를 줄여야 한다. 일명 가지치기(pruning).
 
  




'일기' 카테고리의 다른 글

시행착오  (0) 2021.08.29
용어 공부  (0) 2021.08.15
정보처리기사 공부 덕에 바쁘다.  (0) 2021.07.26
오랜만에 시간적 여유가 생겼다.  (0) 2021.07.16
이번 달 중으로 블로그 한 번 정리해야겠다.  (0) 2021.07.10

댓글