일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
- 엔터프라이즈 아키텍처
- 파이썬
- 기초
- 클래스 다이어그램
- 사용법
- 데이터 처리
- class diagram
- Enterprise Architect
- EA
- 소프트웨어공학
- data
- pandas
- Activity Diagram
- 예제
- Tutorial
- 데이터
- Python
- 판다스
- 데이터 관리
- Turorial
- Component Dagram
- 코딩
- 튜토리얼
- 컴포넌트 다이어그램
- 이론
- 만들기
- 액티비티 다이어그램
- example
- UML
- sample
- Today
- Total
SW개발 지식 쌓기
판다스(Pandas) 튜토리얼(Tutorial) - 판다스 메소드(Pandas Method) 본문
- 패키지 import
튜토리얼을 진행하기 위해서는 아래의 패키지를 import 해야한다.
튜토리얼을 진행하기 위해서는 아래의 과정을 수행해야한다.
- 메소드
통계
일반적으로 메소드는 누락 된 데이터 (NaN)을 제외한다.
평균 값 출력 통계 - 열 기준
[61] Pandas의 내장 메소드인 mean()을 사용하여서 각 열의 평균 값을 출력한다.
* 'F' 라벨의 경우 NaN 값이 포함되어 있지만 NaN 값을 제외하고 평균값이 계산된 것을 알 수 있다.
평균 값 출력 통계 - 행 기준
[62] df.mean(1)을 사용하면 각 행 기준의 평균 값을 출력한다.
* '2013-01-01' 인덱스의 경우 NaN 값이 포함되어 있지만 NaN 값을 제외하고 평균값이 계산된 것을 알 수 있다.
NaN 값이 있는 SeriesData를 SeriesData 값에 맞추어 DataFrame에 적용하기
[63] 1,3,5,Nan,6,8 SeriesData를 dates 인덱스를 가지게 만들고 shift 메소드로 Data를 우측으로 2번 shift 한 결과를 s에 저장
* 우측으로 2번 shift 되었으므로 리스트 [0][1]는 NaN 값이 들어오게 된다.
[64] s 출력
[65] df.sub('Series 데이터', 기준점) 메소드를 사용하여 인덱스를 기준으로 데이터를 df에 넣는다.
* Series 데이터 값에 맞추어 NaN 이 있는 경우 나머지 행도 NaN 값으로 처리된다.
적용
데이터에 메소드 적용
[66] np.cumsum 메소드를 df에 사용하여 값을 변경한다.
* np.cumsum은 각 원소들의 누적 합을 표시해주는 함수, 현재 값과 이전 값의 합을 표시해준다.
* Nan 값의 경우 무시되어지고 메소드가 처리되는 것을 알 수 있다.
[67] lambda 함수를 df에 사용하여 값을 변경한다.
* lambda는 각 원소들를 전부 순회하는 함수이며, 이미 계산 된 결과 값을 다음 계산시에 사용한다.
* x.max 는 원소의 최대값을 x.min 은 원소의 최소값을 선택하는 함수이다.
히스토그램
문자열 메소드
'Python > Pandas' 카테고리의 다른 글
판다스(Pandas) 튜토리얼(tutorial) - 그룹핑(Grouping) (0) | 2019.03.13 |
---|---|
판다스(Pandas) 튜토리얼(Tutorial) - Merge(병합), join(중복), append(추가) (0) | 2019.03.07 |
판다스(Pandas) 튜토리얼(Tutorial) - 누락 데이터(Nan data) (0) | 2019.02.28 |
판다스(Pandas) 튜토리얼(Tutorial) - 데이터 선택(data select) (0) | 2019.02.28 |
판다스(Pandas) 튜토리얼(Tutorial) - 데이터 보기(data view) (0) | 2019.02.28 |