SW개발 지식 쌓기

판다스(Pandas) 튜토리얼(tutorial) - 객체(object) 생성 본문

Python/Pandas

판다스(Pandas) 튜토리얼(tutorial) - 객체(object) 생성

bykitty 2019. 2. 28. 10:56
반응형
  • 패키지 import

튜토리얼을 진행하기 위해서는 아래의 패키지를 import 해야한다.

 


  • 객체 생성

Pandas에서 사용되는 객체는 다음과 같다.

 

 차원

이름 

설명 

 1차원

Series 

 균일한 유형의 배열로 표시된 1차원 데이터

 2차원

DataFrame 

 잠재적으로 이질적으로 유형이 지정된 열이있는 

크기가 가변적인 테이블 형식의 2차원 데이터

 

1차원 정수 인덱스를 생성하는 방법은 다음과 같다.

 

 

[3] s 변수에 Pandas에서 사용되는 Series 데이터를 만들어서 저장, Series 객체에는 1,3,5,Nan,6,8이 순서대로 입력

* np.nan 메소드는 numpy에서 제공하는 함수로 nan (null) 값을 생성해주는 메소드

[4] s로 입력하였을때 에러가 나는 경우 print(s)로 출력, python version 및 실행환경에 따라 차이가 있음

 

datetime 인덱스를와 지정된 컬럼을 통해, 2차원의 DataFrame을 생성하는 방법은 다음과 같다.

 

 

[5] dates 변수에 2013-01-01 부터 6일간의 Series 데이터를 입력

pd.date_range 메소드는 pandas에서 제공하는 함수로 지정 int 부터 periods 까지의 Series를 생성해주는 메소드

[7] df(dataframe) 변수에 6에서 4사이의 가우시안 정규 분포 랜덤 값을 컬럼 A, B, C, D에 미리 생성한 dates 순으로 입력

* np.random.randn 메소드는 numpy에서 제공하는 함수로 random은 임의의 난수를 생성하고 randn은 해당 범위의 가우시안 표준 정규 분포 값을 생성해주는 메소드

[6][8] dates, df로 입력하였을때 에러가 나는 경우 print(s)로 출력, python version 및 실행환경에 따라 차이가 있음

 

Series 형태로 변환 될 수 있는 객체의 값을 입력하여 DataFrame 생성

 

 

[9] df2 변수에 다양한 방법의 Series 생성 방법을 통해서 Series 데이터를 입력

 

DataFrame의 열은 각각의 다른 dtype을 가진다

 

 

[10] df2 변수의 dtype을 출력, 각 컬럼별로 다른 dtype 값을 가지는 것을 볼 수 있다


 

반응형