판다스(Pandas) 튜토리얼(tutorial) - 시계열(Time Series) 데이터 (Data)
- 패키지 import
튜토리얼을 진행하기 위해서는 아래의 패키지를 import 해야한다.
- 시계열
Pandas는 주기 변환 중에 리샘플링 동작을 수행하기 위한 간단하고 효율적인 기능을 가진다.
시계열 데이터 생성 및 시계열 인덱스 변환
[108] 2012년 1월 1일 부터 100일을 초 주기로 생성
* 생성시 파라미터로 입력되는 freq는 다음과 같다.
Alias Description
B business day frequency (주말이 아닌 평일)
C custom business day frequency
D calendar day frequency (일)
W weekly frequency (주-일요일)
M month end frequency (각 달의 마지막 날)
BM business month end frequency (주말이 아닌 평일 중에서 각 달의 마지막 날)
CBM custom business month end frequency
MS month start frequency (각 달의 첫날)
BMS business month start frequency (주말이 아닌 평일 중에서 각 달의 첫날)
CBMS custom business month start frequency
Q quarter end frequency (분기)
BQ business quarter endfrequency
QS quarter start frequency
BQS business quarter start frequency
A year end frequency
BA business year end frequency
AS year start frequency
BAS business year start frequency
BH business hour frequency
H hourly frequency
T, min minutely frequency
S secondly frequency
L, ms milliseonds
U, us microseconds
N nanoseconds
[109] 108에서 생성 된 시간을 인덱스로하고, 생성 된 길이 만큼 0에서 500의 랜덤한 값을 생성
[110] 109에서 생성 된 데이터를 5분 단위로 리샘플링하여 합산
* 리샘플링을 하게되면 groupby와 같이 그룹연산(단위 구간 연산)을 하여 대표값을 구한다.
[111] 2012년 3월 6일 00:00분 부터 5일 (periods=5, freq='D')을 생성
[112] 111에서 생성 된 시간을 인덱스로하고, 생성 된 길이의 만큼의 랜덤한 값을 생성
[113] 112의 결과 출력
[114] 113에서 생성된 인덱스 값을 'UTC' 값으로 변환
* UTC (Universal Time Code), 협정 세계표준시로 전세계적으로 표준으로 사용되는 시간 단위
[115] 114의 결과 출력
다른 단위로의 시계열 인덱스 변환
[116] 114에서 생성된 인덱스 값을 'US/Eastern' 값으로 변환
* 미국 동부 시간
시간 범위 표현의 변환
[117] 2012년 1월 1일 부터 5달간의 마지막 일자(periods=5, freq='M')를 생성
[118] 117에서 생성된 시간을 인덱스로하고, 생성된 길이 만큼의 랜덤한 값을 생성
[119] 118의 결과 출력
[120] 118의 인덱스를 달 기준으로 변경
[121] 120의 결과 출력
[122] 120의 인덱스를 달의 첫 시작일 기준으로 변경