SW개발 지식 쌓기

판다스(Pandas) 튜토리얼(tutorial) - 그룹핑(Grouping) 본문

Python/Pandas

판다스(Pandas) 튜토리얼(tutorial) - 그룹핑(Grouping)

bykitty 2019. 3. 13. 13:49
반응형
  • 패키지 import

튜토리얼을 진행하기 위해서는 아래의 패키지를 import 해야한다.

 


  • 그룹화

그룹화는 다음 단계 중 하나 이상을 포함하는 단계를 말한다.

 

  • 몇 가지 기준에 따라 그룹으로 데이터 분할
  • 독립적으로 각 그룹에 기능 적용
  • 결과를 데이터 구조로 결합

그룹화한 결과에 sum() 함수를 적용한 DataFrame 출력

 

 

[91] 'A','B','C','D' 컬럼을 가지고 각각의 컬럼 값을 가지는 Dataframe 생성

[92] DataFrame 출력

[93] 'A' 컬럼을 기준으로 그룹화하고 각 값을 합산한 값을 출력

* 'A' 컬럼의 문자인 'bar'와 'foo'로 그룹화 된것을 볼 수 있고, 정수값을 가진 'C','D' 컬럼만 sum() 함수 값을 반환한다.

* 문자열 값을 가진 'B' 컬럼은 자동으로 출력에서 제외된다.

 

다중 열을 그룹화하여 sum() 함수 적용한 DataFrame 출력

 

 

 

[94] 'A' 컬럼과 'B' 컬럼을 기준으로 그룹화하고 각 값을 합산한 값을 출력

* 'A' 컬럼의 문자인 'bar'와 'foo'로 그룹화되고 각 그룹화에 'B' 컬럼의 문자인 'one', 'two', 'three'가 그룹화된 것을 볼 수 있고, 

정수값을 가진 'C','D' 컬럼이 각각의 그룹화에 맞게 sum() 함수 값을 반환한다.

* 그룹화 시 컬럼명을 먼저 쓴 기준으로 1열이 결정된다.

 


 

반응형