Python Library 중 하나인 Pandas를 이용하여 DataFrame을 생성해보자
DataFrame 이란?
Pandas의 2차원 데이터 객체
DataFrame 객체와 parameter 설명
class pandas.DataFrame(data=None, index=None, columns=None, dtype=None, copy=False)
1) data : ndarray (structured or homogeneous), Iterable, dict, or DataFrame
= 데이터프레임으로 만들고자 하는 데이터를 전달, 아래 타입의 객체들을 전달할 수 있음
- ndarray : numpy를 통해 생성한 ndarray 객체
- Iterable : 반복가능한 객체 (예: list, set, tuple, str 등)
- dict : dictionary 객체
- DataFrame : DataFrame 객체
2) index : Index or array-like
= 만들어질 데이터프레임에서 사용할 Index(행) 를 지정
3) columns : Index or array-like
= 만들어질 데이터프레임에서 사용할 columns(열) 를 지정
4) dtype : dtype, default None
= 데이터프레임의 데이터타입을 직접 지정
5) copy : bool, default False
DataFrame 만들기
이제 아래와 같이 데이터 프레임을 직접 만들 수 있다(실행결과는 이미지 참고).
import numpy as np
import pandas as pd
# 데이터프레임으로 생성할 데이터 정의
data1 = [[1,2,3],[4,5,6],[7,8,9]] #iterable
data2 = [{'kor':10, 'eng':20},{'kor':10, 'eng':20}] #dict
data3 = {'kor':[10,20,30], 'eng':[40,50,60]} #dict
data4 = [pd.Series([1,2,3]),pd.Series([4,5,6]),pd.Series([7,8,9])] #Series
data5 = np.array([[1,2,3],[4,5,6],[7,8,9],[10,11,12]]) #ndarray
# 데이터프레임 생성하기
df1 = pd.DataFrame(data1)
df1 = pd.DataFrame(data1, index=['John','Emma','Belita'], columns=['eng','kor','math'])
df2 = pd.DataFrame(data2)
df3 = pd.DataFrame(data3)
df4 = pd.DataFrame(data4)
df5 = pd.DataFrame(data5)
반응형
댓글