본문 바로가기
Loss Function 정리 Loss function(손실함수) 딥러닝의 목표는? 학습할 수 있는 최적의 가중치(weights)를 찾는 것이다. 신경망은 데이터를 그대로 학습한다. 즉, 신경망은 이미지에 포함된 중요한 특징까지도 기계가 합습한다. 이를 종간간 기계학습(End-To-End)라고 할 수 있다. 처음부터 끝까지 입력 데이터에서 목표한 축력 데이터를 사람의 개입 없이 얻을 수 있다. 신경망 학습에서 사용하는 지표는 손실함수(Loss Function)이다. 손실함수는 신경망 성능이 안 좋은 정도를 나타내며, 수치가 낮을수록 훈력 데이터를 잘 처리하는 것이다. 1. MSE MSE는 각 데이터의 차원에서의 원소의 출력 값과 정답 레이블의 차를 제곱한 후에 그 총합을 구하는 것이다. 2. RMSE MSE에 루트(√)를 씌운 것으로.. 2022. 1. 19.
<Hands On ML> 1주차 정리 polynomial. 얼마나 training 시키냐도 우리의 문제,, 층을 쌓아서 no-linear하게 만드는게-> 딥러닝 기법 no-linear가 융통성있게 잘됨. 결국 하이퍼 파라미터의 문제. regularization 1. validation은 하이퍼파라미터 튜닝을 위해서 존재하는거임. 모델을 사회에 내놓기 전에 점검을 위해 measure의 역할을 하는거다. 2. test 셋으로 일반화로 잘 적응하는지 한 번 더 구분하는거다. 하이퍼파라미터 레이어갯수, 노드, 러닝레이트 bayesian optimization -> 얘도 랜덤 하게 함,. 몇번 돌려보긴 해. 근데 이렇게 하이퍼 파라미터하니까 성능이 어느정도 나오네.. 그럼 요부분을 높여줄까? (acquistion function.) 2021. 12. 22.
[pytorch] 파이토치로 시작하는 Image Segmentation (1) 더보기 잠깐 파이썬 복습하기! (self, init 같은것들이 기억이 안난다) https://www.inflearn.com/questions/4642 https://velog.io/@magnoliarfsit/RePython-1.-self-%EC%9D%B4%ED%95%B4%ED%95%98%EA%B8%B0 1. init 인스턴스 생성시에 init 메서드를 호출한다. 이 __init__은 파이썬에서 클래스의 생성자를 만들때 항상 동일한 규칙입니다. __init__을 사용하면 클래스명을 쓰고 옆에 바로 인자들을 채워 넣음으로써 그 값들을 지닌 객체를 만들어 낼 수 있죠. 2. self 그리고 메서드의 첫 번째 인자는 항상 self여야 한다고 했습니다. 하지만 메서드의 첫 번째 인자가 항상 self여야 한다는 것.. 2021. 12. 16.
Object Detection Object Detection = 1. Multi-Labeled Classification + Bounding Box Regression (Localization) 여려가지 물체에 대한 classification + 물체의 위치정보를 파악하는 Localization 2. 1-Stage, 2 Stage Detectors 1-Stage Detector : Regional Proposal + Classification이 순차적으로 이루어짐 1) Region proposal -> Classification Region proposal : Selective Search, Region Proposal Network , etc - R-CNN (R-CNN, Fast R-CNN, Faster R-CNN 등등등) 2 St.. 2021. 9. 2.
Numpy & Pandas 기본 개념 이해하기 Numpy 모듈 ndarray Numpy 를 사용하는 이유 1. 성능이 파이썬 리스트보다 빠름. 2. 메모리 사이즈도 파이썬 리스트보다 적은 메모리 사용 3. 머신러닝/딥러닝에 필요한 선형대수와 통계함수를 내장하고 있다. ndarray의 경우에는 다차원 리스트를 표현할때 각 변수의 id가 바로옆으로 붙어있는데 --> 연속된 메모리 Vectorization을 사용했다 python list는 그렇지 않다. --> 연속되지 않은 메모리 명시적인 loop 사용 2021. 7. 1.
1. 머신러닝,딥러닝 개요 1. 머신러닝 정해진 코드대로 업무를 수행 -> 기본적인 인공지능 주어진 데이터를 기반으로 패턴을 파악하여 학습 -> 머신러닝 -logistic regression -naive bayes -support vector machine 주어진 데이터를 바탕으로 학습하므로 데이터에 없는 정보는 활용할 수 없으며, 데이터를 기반으로 결론을 내리므로 데이터의 역할이 매우 중요합니다. - 머신러닝은 이런 질문에서부터 시작한다. 우리가 어떤것을 작동시키기 위해 '어떻게 명령할지 알고 있는 것' 이상으로 컴퓨터가 처리하는 것이 가능한가? 그리고 특정 작업을 수행하는 법을 스스로 학습할 수 있는가? 프로그래머가 직접 만든 데이터처리 규칙 대신 컴퓨터가 데이터를 보고 자동으로 이런 규칙을 학습할 수 있을까? - 지도학습 /.. 2021. 4. 29.
DL - 0218 2021. 2. 18.
ML 2021. 2. 9.
1주차 머신러닝 2021. 1. 22.
9주차 review 1. 풀코드 2021. 1. 14.
(ch.1) Image Classification - GoogLENet " 망이 넓고, 깊을 수록 성능이 좋다." 구글넷은 이 점을 지적했음 깊고 넓은 네트워크 정말 좋기만 해 ? 1. 학습 시키는데 오래걸린다. -> 연산량이 많고, 파라메터가 많다. -파라메터 수를 어떻게 하면 줄일 수 있을까? A : 1x1 conv, Tensor factorization 1x1 conv : 여러개의 입력 feature가 있을 때, 채널 방향으로 연산을 하여서 filter의 개수만큼 output이 생성되어서 width와 height는 변하지 않음에도 채널의 크기를 filter의 개수만큼 자유롭게 변화시킬 수 있다. 이를 통해 채널 수를 줄일 수 있다면 당연히 파라미터 수도 줄겠죠. Tensor factorization : 행렬을 분해해 다른 행렬로 factorization 하는 경우 -연.. 2020. 12. 30.
(ch.4) 자연어처리 - 단어를 숫자로 표현 1. 컴퓨터가 보는 문자 컴퓨터는 보통 ASCII TABLE을 이용해 문자를 저장한다. 유니코드, UTF-8 encoding등으로 문자를 표현하고 저장한다 ( 한글은 유니코드 , UTF-8에 포함 ) ASCII는 8-bit으로 되어있어서 0~127까지 표현가능 2. 컴퓨터가 보는 단어 3. 4. 말뭉치 Corpus -특정 목적을 가진 언어의 표본, 분석의 용이성을 위해 형태소 분석이 포함되기도 한다. 언어학 연구에 쓰이는 확률/통계적인 자료이며, 딥러닝에도 유용하게 쓰인다 5. Word2Vec 2020. 12. 30.