SW개발 지식 쌓기

판다스(Pandas) 튜토리얼(Tutorial) - 판다스 메소드(Pandas Method) 본문

Python/Pandas

판다스(Pandas) 튜토리얼(Tutorial) - 판다스 메소드(Pandas Method)

bykitty 2019. 2. 28. 15:03
반응형
  • 패키지 import

튜토리얼을 진행하기 위해서는 아래의 패키지를 import 해야한다.

 


튜토리얼을 진행하기 위해서는 아래의 과정을 수행해야한다.

 

 


  • 메소드

 


통계


 

일반적으로 메소드는 누락 된 데이터 (NaN)을 제외한다.

 

평균 값 출력 통계 - 열 기준

 

 

[61] Pandas의 내장 메소드인 mean()을 사용하여서 각 열의 평균 값을 출력한다.

* 'F' 라벨의 경우 NaN 값이 포함되어 있지만 NaN 값을 제외하고 평균값이 계산된 것을 알 수 있다.

 

평균 값 출력 통계 - 행 기준

 

 

[62] df.mean(1)을 사용하면 각 행 기준의 평균 값을 출력한다.

* '2013-01-01' 인덱스의 경우 NaN 값이 포함되어 있지만 NaN 값을 제외하고 평균값이 계산된 것을 알 수 있다.

 

 

NaN 값이 있는 SeriesData를 SeriesData 값에 맞추어 DataFrame에 적용하기

 

 

[63] 1,3,5,Nan,6,8 SeriesData를 dates 인덱스를 가지게 만들고 shift 메소드로 Data를 우측으로 2번 shift 한 결과를 s에 저장

* 우측으로 2번 shift 되었으므로 리스트 [0][1]는 NaN 값이 들어오게 된다. 

[64] s 출력

[65] df.sub('Series 데이터', 기준점) 메소드를 사용하여 인덱스를 기준으로 데이터를 df에 넣는다.

* Series 데이터 값에 맞추어 NaN 이 있는 경우 나머지 행도 NaN 값으로 처리된다.

 


적용


 

데이터에 메소드 적용

 

 

[66] np.cumsum 메소드를 df에 사용하여 값을 변경한다.

* np.cumsum은 각 원소들의 누적 합을 표시해주는 함수, 현재 값과 이전 값의 합을 표시해준다.

* Nan 값의 경우 무시되어지고 메소드가 처리되는 것을 알 수 있다.

[67] lambda 함수를 df에 사용하여 값을 변경한다.

* lambda는 각 원소들를 전부 순회하는 함수이며, 이미 계산 된 결과 값을 다음 계산시에 사용한다.

* x.max 는 원소의 최대값을 x.min 은 원소의 최소값을 선택하는 함수이다.

 


히스토그램


 

 


문자열 메소드


 

 


 

반응형