본문 바로가기

칼퇴/엑셀을 대신하는 파이썬

[python] 2_2. 데이터 검토하기_컬럼별 통계값 확인(for문)

데이터프레임의 전체적인 정보를 확인했으면, 각 컬럼별 합계, 평균 등의 통계값을 확인해볼 수 있다.

 

1. 개별 컬럼의 총합, 평균 확인[ 데이터명['컬럼명'].sum(),  데이터명['컬럼명'].mean()  ]

##imp컬럼의 합계 구하기
dt1['imps'].sum()

##imps컬럼의 평균값 연산
dt1['imps'].mean()
[결과]
 1. 데이터프레임 형태 확인
2. imps열의 평균값 연산

 

 

2. 모든 컬럼의 개별 합계 한번에 확인[ for문 사용 ]

- 결과값으로 (행개수, 열개수) 가 조회됩니다.

- 모든 컬럼의 각각의 평균은 describe()함로 손쉽게 확인 가능 (참고: https://hyream.tistory.com/4)

##FOR문 사용해서 각 컬럼별 합계 한번에 조회하기

#합계를 구하고자 하는 수치형 컬럼만 남긴 dt 생성 (drop(['컬럼명'])은 컬럼을 제외/삭제하는 함수)
dt2 = dt1.drop([ 'period'], axis=1)

#수치형 컬럼만 남았는지 확인 (int, float은 대표적인 수치형 데이터)
dt.dtypes

#모든 컬럼의 개별 합계 조회
for i in dt1.columns:    
    print(i, dt2[i].sum())

 

[결과]
1. 데이터 타입 조회 (int는 정수, float은소수)

2. for문을 사용해서 각 컬럼 합계 한번에 연산