판다스(Pandas) 튜토리얼(tutorial) - 객체(object) 생성
- 패키지 import
튜토리얼을 진행하기 위해서는 아래의 패키지를 import 해야한다.
- 객체 생성
Pandas에서 사용되는 객체는 다음과 같다.
차원 |
이름 |
설명 |
1차원 |
Series |
균일한 유형의 배열로 표시된 1차원 데이터 |
2차원 |
DataFrame |
잠재적으로 이질적으로 유형이 지정된 열이있는 크기가 가변적인 테이블 형식의 2차원 데이터 |
1차원 정수 인덱스를 생성하는 방법은 다음과 같다.
[3] s 변수에 Pandas에서 사용되는 Series 데이터를 만들어서 저장, Series 객체에는 1,3,5,Nan,6,8이 순서대로 입력
* np.nan 메소드는 numpy에서 제공하는 함수로 nan (null) 값을 생성해주는 메소드
[4] s로 입력하였을때 에러가 나는 경우 print(s)로 출력, python version 및 실행환경에 따라 차이가 있음
datetime 인덱스를와 지정된 컬럼을 통해, 2차원의 DataFrame을 생성하는 방법은 다음과 같다.
[5] dates 변수에 2013-01-01 부터 6일간의 Series 데이터를 입력
* pd.date_range 메소드는 pandas에서 제공하는 함수로 지정 int 부터 periods 까지의 Series를 생성해주는 메소드
[7] df(dataframe) 변수에 6에서 4사이의 가우시안 정규 분포 랜덤 값을 컬럼 A, B, C, D에 미리 생성한 dates 순으로 입력
* np.random.randn 메소드는 numpy에서 제공하는 함수로 random은 임의의 난수를 생성하고 randn은 해당 범위의 가우시안 표준 정규 분포 값을 생성해주는 메소드
[6][8] dates, df로 입력하였을때 에러가 나는 경우 print(s)로 출력, python version 및 실행환경에 따라 차이가 있음
Series 형태로 변환 될 수 있는 객체의 값을 입력하여 DataFrame 생성
[9] df2 변수에 다양한 방법의 Series 생성 방법을 통해서 Series 데이터를 입력
DataFrame의 열은 각각의 다른 dtype을 가진다
[10] df2 변수의 dtype을 출력, 각 컬럼별로 다른 dtype 값을 가지는 것을 볼 수 있다