Python/Pandas
판다스(Pandas) 튜토리얼(Tutorial) - 누락 데이터(Nan data)
bykitty
2019. 2. 28. 13:49
반응형
- 패키지 import
-
누락 데이터 처리
Pandas는 기본적으로 numpy.nan 값을 사용하여 누락된 데이터를 나타낸다.
기본적으로 nan 값은 계산에 포함되지 않는다.
색인 변경 / 추가 / 삭제

[55] df.reindex 메소드를 통해서 숫자로 구성된 인덱스 값을 날짜 값으로 변경하고, 기존 컬럼에 'E' 컬럼을 추가하여 df1 생성
[56] df1의 2013-01-01, 2013-01-02의 'E' 컬럼의 값을 1로 변경, 'E' 컬럼의 나머지 부분은 값이 없으므로 NaN 값
[57] df1 출력
NaN 데이터 값 삭제

[58] df1에 NaN 값을 가지고 있는 경우 해당 행을 삭제
NaN 데이터 값 입력

[59] df1에 NaN 값을 가지고 있는 경우 해당 값을 5로 변경
NaN 데이터 체크

[60] pd.isna 메소드를 통해 NaN 데이터가 있는 경우 True를 반환한다.
반응형