SW개발 지식 쌓기

판다스(Pandas) 튜토리얼(tutorial) - 시계열(Time Series) 데이터 (Data) 본문

Python/Pandas

판다스(Pandas) 튜토리얼(tutorial) - 시계열(Time Series) 데이터 (Data)

bykitty 2019. 3. 22. 09:58
반응형
  • 패키지 import

튜토리얼을 진행하기 위해서는 아래의 패키지를 import 해야한다.

 




  • 시계열

Pandas는 주기 변환 중에 리샘플링 동작을 수행하기 위한 간단하고 효율적인 기능을 가진다.

 

시계열 데이터 생성 및 시계열 인덱스 변환

 

 

[108] 2012년 1월 1일 부터 100일을 초 주기로 생성

* 생성시 파라미터로 입력되는 freq는 다음과 같다.

Alias   Description

B       business day frequency (주말이 아닌 평일)

C       custom business day frequency 

D       calendar day frequency (일)

W       weekly frequency (주-일요일)

M       month end frequency (각 달의 마지막 날)

BM      business month end frequency (주말이 아닌 평일 중에서 각 달의 마지막 날)

CBM     custom business month end frequency

MS      month start frequency (각 달의 첫날)

BMS     business month start frequency (주말이 아닌 평일 중에서 각 달의 첫날)

CBMS    custom business month start frequency

Q       quarter end frequency (분기)

BQ      business quarter endfrequency 

QS      quarter start frequency

BQS     business quarter start frequency

A       year end frequency

BA      business year end frequency

AS      year start frequency

BAS     business year start frequency

BH      business hour frequency

H       hourly frequency

T, min  minutely frequency

S       secondly frequency

L, ms   milliseonds

U, us   microseconds

N       nanoseconds

[109] 108에서 생성 된 시간을 인덱스로하고, 생성 된 길이 만큼 0에서 500의 랜덤한 값을 생성

[110] 109에서 생성 된 데이터를 5분 단위로 리샘플링하여 합산

* 리샘플링을 하게되면 groupby와 같이 그룹연산(단위 구간 연산)을 하여 대표값을 구한다.

[111] 2012년 3월 6일 00:00분 부터 5일 (periods=5, freq='D')을 생성

[112] 111에서 생성 된 시간을 인덱스로하고, 생성 된 길이의 만큼의 랜덤한 값을 생성

[113] 112의 결과 출력

[114] 113에서 생성된 인덱스 값을 'UTC' 값으로 변환

* UTC (Universal Time Code), 협정 세계표준시로 전세계적으로 표준으로 사용되는 시간 단위

[115] 114의 결과 출력

 

다른 단위로의 시계열 인덱스 변환

 

 

[116] 114에서 생성된 인덱스 값을 'US/Eastern' 값으로 변환 

* 미국 동부 시간

 

시간 범위 표현의 변환

 

 

[117] 2012년 1월 1일 부터 5달간의 마지막 일자(periods=5, freq='M')를 생성 

[118] 117에서 생성된 시간을 인덱스로하고, 생성된 길이 만큼의 랜덤한 값을 생성

[119] 118의 결과 출력

[120] 118의 인덱스를 달 기준으로 변경

[121] 120의 결과 출력

[122] 120의 인덱스를 달의 첫 시작일 기준으로 변경

 


 

 

 

반응형