SW개발 지식 쌓기

판다스(Pandas) 튜토리얼(Tutorial) - 누락 데이터(Nan data) 본문

Python/Pandas

판다스(Pandas) 튜토리얼(Tutorial) - 누락 데이터(Nan data)

bykitty 2019. 2. 28. 13:49
반응형
  • 패키지 import

튜토리얼을 진행하기 위해서는 아래의 패키지를 import 해야한다.

 


튜토리얼을 진행하기 위해서는 아래의 과정을 수행해야한다.

 

 


  • 누락 데이터 처리


 

Pandas는 기본적으로 numpy.nan 값을 사용하여 누락된 데이터를 나타낸다.

 

기본적으로 nan 값은 계산에 포함되지 않는다.

 

색인 변경 / 추가 / 삭제 

 

 

[55] df.reindex 메소드를 통해서 숫자로 구성된 인덱스 값을 날짜 값으로 변경하고, 기존 컬럼에 'E' 컬럼을 추가하여 df1 생성

[56] df1의 2013-01-01, 2013-01-02의 'E' 컬럼의 값을 1로 변경, 'E' 컬럼의 나머지 부분은 값이 없으므로 NaN 값

[57] df1 출력

 

 

NaN 데이터 값 삭제

 

 

[58] df1에 NaN 값을 가지고 있는 경우 해당 행을 삭제

 

NaN 데이터 값 입력

 

 

[59] df1에 NaN 값을 가지고 있는 경우 해당 값을 5로 변경

 

NaN 데이터 체크

 

 

[60] pd.isna 메소드를 통해 NaN 데이터가 있는 경우 True를 반환한다.

 


 

반응형