일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 | 29 |
30 | 31 |
- 소프트웨어공학
- 액티비티 다이어그램
- 데이터 처리
- 튜토리얼
- 이론
- UML
- 엔터프라이즈 아키텍처
- EA
- 데이터 관리
- 파이썬
- 만들기
- 사용법
- example
- 기초
- pandas
- Turorial
- sample
- 컴포넌트 다이어그램
- 예제
- data
- class diagram
- Activity Diagram
- 클래스 다이어그램
- Enterprise Architect
- Tutorial
- Python
- 데이터
- 판다스
- 코딩
- Component Dagram
- Today
- Total
SW개발 지식 쌓기
판다스(Pandas) 튜토리얼(tutorial) - 객체(object) 생성 본문
- 패키지 import
튜토리얼을 진행하기 위해서는 아래의 패키지를 import 해야한다.
- 객체 생성
Pandas에서 사용되는 객체는 다음과 같다.
차원 |
이름 |
설명 |
1차원 |
Series |
균일한 유형의 배열로 표시된 1차원 데이터 |
2차원 |
DataFrame |
잠재적으로 이질적으로 유형이 지정된 열이있는 크기가 가변적인 테이블 형식의 2차원 데이터 |
1차원 정수 인덱스를 생성하는 방법은 다음과 같다.
[3] s 변수에 Pandas에서 사용되는 Series 데이터를 만들어서 저장, Series 객체에는 1,3,5,Nan,6,8이 순서대로 입력
* np.nan 메소드는 numpy에서 제공하는 함수로 nan (null) 값을 생성해주는 메소드
[4] s로 입력하였을때 에러가 나는 경우 print(s)로 출력, python version 및 실행환경에 따라 차이가 있음
datetime 인덱스를와 지정된 컬럼을 통해, 2차원의 DataFrame을 생성하는 방법은 다음과 같다.
[5] dates 변수에 2013-01-01 부터 6일간의 Series 데이터를 입력
* pd.date_range 메소드는 pandas에서 제공하는 함수로 지정 int 부터 periods 까지의 Series를 생성해주는 메소드
[7] df(dataframe) 변수에 6에서 4사이의 가우시안 정규 분포 랜덤 값을 컬럼 A, B, C, D에 미리 생성한 dates 순으로 입력
* np.random.randn 메소드는 numpy에서 제공하는 함수로 random은 임의의 난수를 생성하고 randn은 해당 범위의 가우시안 표준 정규 분포 값을 생성해주는 메소드
[6][8] dates, df로 입력하였을때 에러가 나는 경우 print(s)로 출력, python version 및 실행환경에 따라 차이가 있음
Series 형태로 변환 될 수 있는 객체의 값을 입력하여 DataFrame 생성
[9] df2 변수에 다양한 방법의 Series 생성 방법을 통해서 Series 데이터를 입력
DataFrame의 열은 각각의 다른 dtype을 가진다
[10] df2 변수의 dtype을 출력, 각 컬럼별로 다른 dtype 값을 가지는 것을 볼 수 있다
'Python > Pandas' 카테고리의 다른 글
판다스(Pandas) 튜토리얼(Tutorial) - 판다스 메소드(Pandas Method) (0) | 2019.02.28 |
---|---|
판다스(Pandas) 튜토리얼(Tutorial) - 누락 데이터(Nan data) (0) | 2019.02.28 |
판다스(Pandas) 튜토리얼(Tutorial) - 데이터 선택(data select) (0) | 2019.02.28 |
판다스(Pandas) 튜토리얼(Tutorial) - 데이터 보기(data view) (0) | 2019.02.28 |
판다스(Pandas)란? - 이론, 기초 (1) | 2019.02.25 |