본문 바로가기

칼퇴/엑셀을 대신하는 파이썬

[python] 2. 데이터 검토하기 (head, tail, shape, columns, info, describe)

불러온 엑셀 데이터가 맞게 들어와있는지 확인해보는 과정입니다.

 

1. 데이터 일부 조회하기 [ 변수명.head('행 개수') , 변수명.tail('행 개수') ]

- 데이터의 상단부터 일부를 확인하고 싶을때는 head(), 아래에서부터 확인할때는 tail()을 사용.

- 행개수를 입력하지 않으면 기본적으로 위/아래에서부터 5개 행을 보여줌

dt = pd.read_csv('경로/파일명.csv') -- dt변수에서 파일 데이터 담기

##위에서부터 데이터 일부 확인
dt.head()

##위에서부터 데이터 일부 확인
dt.tail()
[결과]

 

 

2. 행/열 개수 확인하기 [ 변수명.shape ]

- 결과값으로 (행개수, 열개수) 가 조회됩니다.

##dt데이터의 행과 열개수를 조회
dt.shape

 

[결과]

 

 

3. 열(column)이름 확인하기 [ 변수명.columns]

- 불러온 데이터의 컬럼명을 확인합니다.

dt.columns

 

[결과]

 

 

4. 열(column)별 데이터 정보 확인하기  [ 변수명.info() ]

- 결과값으로 각 열별로 NULL(값없음)이 아닌 데이터 개수와 데이터 타입이 조회됩니다.

dt.info()

 

[결과]

 

 

5. 열(column)별 요약 통계 수치 확인하기  [ 변수명.describe() ]

- 수치형 열들의 개별 요약 통계값을 조회합니다.

- 열별 개수(count) , 평균(mean), 편차(std), 최대/최소값(max,min), 분위수값(25%,50%,75%) 확인

dt.describe()
[결과]