#하기 싫을 때 한 번 해주는게 가장 큰 성장의 발판이 된다. 이게 뭐라고 이글작성하는데 3시간걸렸다
1. Pandas 란?
Pandas는 파이썬에서 사용하는 데이터분석 라이브러리로, 행과 열로 이루어진 데이터 객체를 만들어 다룰 수 있게 되며 보다 안정적으로 대용량의 데이터들을 처리하는데 매우 편리한 도구 입니다.
2.Pandas는 총 세 가지의 데이터 구조를 사용합니다.
- 시리즈(Series)
- 데이터프레임(DataFrame)
- 패널(Panel)
1) 시리즈(Series)
시리즈 클래스는 1차원 배열의 값(values)에 각 값에 대응되는 인덱스(index)를 부여할 수 있는 구조를 갖고 있습니다.
sr = pd.Series([17000, 18000, 1000, 5000],
index=["피자", "치킨", "콜라", "맥주"])
print('시리즈 출력 :')
print('-'*15)
print(sr)
시리즈 출력 :
---------------
피자 17000
치킨 18000
콜라 1000
맥주 5000
dtype: int64
값(values)과 인덱스(index)를 출력합니다.
print('시리즈의 값 : {}'.format(sr.values))
print('시리즈의 인덱스 : {}'.format(sr.index))
시리즈의 값 : [17000 18000 1000 5000]
시리즈의 인덱스 : Index(['피자', '치킨', '콜라', '맥주'], dtype='object')
2) 데이터프레임(DataFrame)
데이터프레임은 2차원 리스트를 매개변수로 전달합니다. 2차원이므로 행방향 인덱스(index)와 열방향 인덱스(column)가 존재합니다. 다시 말해 행과 열을 가지는 자료구조입니다. 시리즈가 인덱스(index)와 값(values)으로 구성된다면, 데이터프레임은 열(columns)까지 추가되어 열(columns), 인덱스(index), 값(values)으로 구성됩니다. 이 세 개의 구성 요소로부터 데이터프레임을 생성해봅시다.
values = [[1, 2, 3], [4, 5, 6], [7, 8, 9]]
index = ['one', 'two', 'three']
columns = ['A', 'B', 'C']
df = pd.DataFrame(values, index=index, columns=columns)
print('데이터프레임 출력 :')
print('-'*18)
print(df)
데이터프레임 출력 :
------------------
A B C
one 1 2 3
two 4 5 6
three 7 8 9
생성된 데이터프레임으로부터 인덱스(index), 값(values), 열(columns)을 각각 출력해보겠습니다.
print('데이터프레임의 인덱스 : {}'.format(df.index))
print('데이터프레임의 열이름: {}'.format(df.columns))
print('데이터프레임의 값 :')
print('-'*18)
print(df.values)
데이터프레임의 인덱스 : Index(['one', 'two', 'three'], dtype='object')
데이터프레임의 열이름: Index(['A', 'B', 'C'], dtype='object')
데이터프레임의 값 :
------------------
[[1 2 3]
[4 5 6]
[7 8 9]]
'머신러닝-딥러닝 > study' 카테고리의 다른 글
daily 개념 -1 (semantic segmetation,hugging face, ) (0) | 2022.02.07 |
---|---|
0120_DL study (Finetuning,pretrained,Pseudo labeling,tta) (0) | 2022.01.20 |
1. Pytorch 첫 걸음 (torch함수, backprop,dim...) (0) | 2022.01.19 |
Loss Function 정리 (0) | 2022.01.19 |
[pytorch] 파이토치로 시작하는 Image Segmentation (1) (0) | 2021.12.16 |