본문 바로가기
etc

[Pandas] - DataFrame 생성하기

by saltyzun 2020. 10. 23.

Python Library 중 하나인 Pandas를 이용하여 DataFrame을 생성해보자

 

DataFrame 이란?

Pandas의 2차원 데이터 객체

 

DataFrame 객체와 parameter 설명

class pandas.DataFrame(data=None, index=None, columns=None, dtype=None, copy=False)

 

 1) data : ndarray (structured or homogeneous), Iterable, dict, or DataFrame

   = 데이터프레임으로 만들고자 하는 데이터를 전달, 아래 타입의 객체들을 전달할 수 있음

     - ndarray : numpy를 통해 생성한 ndarray 객체

     - Iterable : 반복가능한 객체 (예: list, set, tuple, str 등)

     - dict : dictionary 객체

     - DataFrame : DataFrame 객체

 

 2) index : Index or array-like

   = 만들어질 데이터프레임에서 사용할 Index(행) 를 지정

 

 3) columns : Index or array-like

   = 만들어질 데이터프레임에서 사용할 columns(열) 를 지정

 

 4) dtype : dtype, default None

   = 데이터프레임의 데이터타입을 직접 지정

 

 5) copy : bool, default False

 

DataFrame 만들기 

이제 아래와 같이 데이터 프레임을 직접 만들 수 있다(실행결과는 이미지 참고).

import numpy as np
import pandas as pd

# 데이터프레임으로 생성할 데이터 정의
data1 = [[1,2,3],[4,5,6],[7,8,9]] #iterable
data2 = [{'kor':10, 'eng':20},{'kor':10, 'eng':20}] #dict
data3 = {'kor':[10,20,30], 'eng':[40,50,60]} #dict
data4 = [pd.Series([1,2,3]),pd.Series([4,5,6]),pd.Series([7,8,9])] #Series
data5 = np.array([[1,2,3],[4,5,6],[7,8,9],[10,11,12]]) #ndarray


# 데이터프레임 생성하기
df1 = pd.DataFrame(data1)
df1 = pd.DataFrame(data1, index=['John','Emma','Belita'], columns=['eng','kor','math'])
df2 = pd.DataFrame(data2)
df3 = pd.DataFrame(data3)
df4 = pd.DataFrame(data4)
df5 = pd.DataFrame(data5)

 

반응형

댓글