머신러닝-딥러닝/study

(ch.1) 딥러닝의 개요 : classification 이란 무엇인가

복복씨 2020. 12. 24. 00:08

 

딥러닝:

뉴럴 넷 이용,

다수의 레이어 이용,

보다 고차원 적임.

end-to-end.

training 시간이 오래걸림

 

머신러닝:

트레이닝 데이터셋 작음,

사람이 직접 feature을 찾아서 넣어야함. 

 

1,2,3 은 label 값(정답 값)이 있느냐 없느냐

1은 지도학습 : 라벨이 있음 (classifier로 사용)

3은 비지도학습 : 라벨이 없음 (clustering, 군집 알고리즘을 통해 클래스를 나눠서 사용)

 

4. Reinforcement Learning :

직접적으로 트레이닝을 하고자 하는 환경을 경험을 하면서 trial&error 시행착오로 환경에 대해 학습을 하며

이에 대해서 Action에 대한 policy를 학습하는 과정을 뜻함.

 

5. 딥러닝

2-layer 이상 심층 네트워크

 

Classfication vs Clustering

Classification:

- 주어진 데이터를 주어진 클래스에 의해 분류하는 법을 학습

Clustering:

- 주어진 데이터를 데이터의 특징에 의해 스스로 클래스로 분류

 

Classification vs Regression

Classification:

-주어진 데이터가 어떤 라벨(클래스)인지 예측하는 것.

-discrete한 output을 가짐

 

Regression

-주어진 데이터의 '경향성'을 파악하고 함수를 예측 하는 것

-시계열의 미래의 값을 예측 가능

-연속적인 output을 가짐

 

Class 의 수, Feautres

Class의 수:

Binary class & multi class

분류하고자 하는 class에 따라서 다른 접근법 사용

 

Data Feature 의 특징:

데이터의 분포 특성에 따라서 더 적합한 classifier를 사용하는 것이 바람직함 (선형인지 Linear, 비선형인지 nonlinear)

 

1 ) 사람이 힌트를 주고 알려주는 것

2 ) deep learning 지가 알아서 학습함.

End to End : 전처리 과정, feature engineering 없이 데이터만 넣으면 알아서 학습하여 input을 넣으면 output이 나오는 모델

 

*

Classification : 어떤 물체가 있을 때, 이 물체가 우리가 알고자하는 클래스 내부에 있는지 없는지 그 클래스 중에서 어떤 클래스 인지

Localization : 그 물체의 위치가 어디 있는지 판단

Object Detection : classification 과 localization 둘 다 수행, 여러개의 물체가 있을 때 여러가지로 detection을 할 수 있다.

Instance Segmentation : 이 물체들이 어떤것인지 & 어디있는지 & 어떤 픽셀에 존재하는지까지 segmentation

 

 

Feature Map

:

Input 에 가까울 수록 세밀

output 에 가까울 수록 고차원적, 전체적 특성을 가짐

input -> output  점점 표현하고자 하는 데이터의 특성차원이 다르게 되면서 각각이 다른 정보를 표현할 수 있다.

레이어별로 가지고 있는 것을 Feature Map이라고 한다.