본문 바로가기
머신러닝-딥러닝/study

1. 머신러닝,딥러닝 개요

by 복복씨 2021. 4. 29.

1. 머신러닝 

정해진 코드대로 업무를 수행 -> 기본적인 인공지능

 

주어진 데이터를 기반으로 패턴을 파악하여 학습 -> 머신러닝

-logistic regression

-naive bayes

-support vector machine

 

주어진 데이터를 바탕으로 학습하므로 데이터에 없는 정보는 활용할 수 없으며, 데이터를 기반으로 결론을 내리므로 데이터의 역할이 매우 중요합니다.

 

- 머신러닝은 이런 질문에서부터 시작한다.

우리가 어떤것을 작동시키기 위해 '어떻게 명령할지 알고 있는 것' 이상으로 컴퓨터가 처리하는 것이 가능한가? 그리고 특정 작업을 수행하는 법을 스스로 학습할 수 있는가? 프로그래머가 직접 만든 데이터처리 규칙 대신 컴퓨터가 데이터를 보고 자동으로 이런 규칙을 학습할 수 있을까? 

 

- 지도학습 / 비지도학습

지도학습 : 정답을 알고 있는 데이터를 기반으로 학습

지도학습의 데이터에는 데이터 특성(feature: 피쳐)뿐만 아니라 정답값도 주어져 있습니다. 주어진 특성 데이터를 기반으로 타깃(target)을 학습할 수 있습니다. 지금부터는 특성 데이터를 원문 그대로 피쳐데이터라고 부르고 피쳐에 대한 타깃을 타깃 데이터라고 부르겠습니다. 

 

주어진 피쳐데이터와 타깃 데이터를 기반으로 나누는 것을 분류(classification)라고 합니다. 

 

비지도학습: 지도학습에서는 타깃 데이터의 정보가 주어져 있는 것과는 반대로, 비지도 학습은 타깃 데이터의 정보가 주어져있지 않습니다. 비지도 학습의 경우, 시각화를 해도 어떤 과일인지 알 수 없으며, 데이터 분포의 형태를 통해 추측만 가능합니다. 타깃 데이터 없이 피쳐 데이터만으로 비지도 학습을 통해 데이터를 나누는 것을 군집(clustering:클러스터링)이라고 부릅니다.

 

- 머신러닝은 데이터로부터 피쳐 데이터와 타깃 데이터의 관계,패턴을 학습해서 분류 혹은 예측하는 것이 목표입니다. 학습을 통해 판단하는 알고리즘을 model (모형) 이라고 합니다.

 

머신러닝의 모형의 특징을 나타내는 요소에는 파라미터(parameter)와 하이퍼파라미터(hyperparameter)가 있습니다.

파라미터 : 데이터에 기반한 값으로 머신러닝 모형

 

 

주어진 데이터를 기반으로 패턴을 파악하여 학습 -> 머신러닝

 

-logistic regression

 

-naive bayes

 

-support vector machine

 

 

 

주어진 데이터를 바탕으로 학습하므로 데이터에 없는 정보는 활용할 수 없으며, 데이터를 기반으로 결론을 내리므로 데이터의 역할이 매우 중요합니다.

 

 

 

- 머신러닝은 이런 질문에서부터 시작한다.

 

우리가 어떤것을 작동시키기 위해 '어떻게 명령할지 알고 있는 것' 이상으로 컴퓨터가 처리하는 것이 가능한가? 그리고 특정 작업을 수행하는 법을 스스로 학습할 수 있는가? 프로그래머가 직접 만든 데이터처리 규칙 대신 컴퓨터가 데이터를 보고 자동으로 이런 규칙을 학습할 수 있을까? 

 

 

 

- 지도학습 / 비지도학습

 

지도학습 : 정답을 알고 있는 데이터를 기반으로 학습

 

지도학습의 데이터에는 데이터 특성(feature: 피쳐)뿐만 아니라 정답값도 주어져 있습니다. 주어진 특성 데이터를 기반으로 타깃(target)을 학습할 수 있습니다. 지금부터는 특성 데이터를 원문 그대로 피쳐데이터라고 부르고 피쳐에 대한 타깃을 타깃 데이터라고 부르겠습니다. 

 

 

 

주어진 피쳐데이터와 타깃 데이터를 기반

비지도 학습 : 정답을 모르는 데이터를 기반으로 학습하는 방법

 

2. 딥러닝

머신러닝에서 한단계 더 발전한 형태

머신러닝의 한 분야.

예측,분류의 역할을 수행하고 신경망(Neural Network)이란 구조를 기반으로 학습하는 방법이다.