전체 글 (3) 썸네일형 리스트형 [python] 2_2. 데이터 검토하기_컬럼별 통계값 확인(for문) 데이터프레임의 전체적인 정보를 확인했으면, 각 컬럼별 합계, 평균 등의 통계값을 확인해볼 수 있다. 1. 개별 컬럼의 총합, 평균 확인[ 데이터명['컬럼명'].sum(), 데이터명['컬럼명'].mean() ] ##imp컬럼의 합계 구하기 dt1['imps'].sum() ##imps컬럼의 평균값 연산 dt1['imps'].mean() [결과] 1. 데이터프레임 형태 확인 2. imps열의 평균값 연산 2. 모든 컬럼의 개별 합계 한번에 확인[ for문 사용 ] - 결과값으로 (행개수, 열개수) 가 조회됩니다. - 모든 컬럼의 각각의 평균은 describe()함수로 손쉽게 확인 가능 (참고: https://hyream.tistory.com/4) ##FOR문 사용해서 각 컬럼별 합계 한번에 조회하기 #합계를 .. [python] 2. 데이터 검토하기 (head, tail, shape, columns, info, describe) 불러온 엑셀 데이터가 맞게 들어와있는지 확인해보는 과정입니다. 1. 데이터 일부 조회하기 [ 변수명.head('행 개수') , 변수명.tail('행 개수') ] - 데이터의 상단부터 일부를 확인하고 싶을때는 head(), 아래에서부터 확인할때는 tail()을 사용. - 행개수를 입력하지 않으면 기본적으로 위/아래에서부터 5개 행을 보여줌 dt = pd.read_csv('경로/파일명.csv') -- dt변수에서 파일 데이터 담기 ##위에서부터 데이터 일부 확인 dt.head() ##위에서부터 데이터 일부 확인 dt.tail() [결과] 2. 행/열 개수 확인하기 [ 변수명.shape ] - 결과값으로 (행개수, 열개수) 가 조회됩니다. ##dt데이터의 행과 열개수를 조회 dt.shape [결과] 3. 열(.. [python] 1. 엑셀 데이터 불러오기 (excel, cvs) 칼퇴를 위한 파이썬의 시작은 "엑셀 파일" 불러오기입니다. Pandas의 read_excel 기능을 이용하면 편집하고자하는 엑셀 파일을 데이터프레임 평태로 볼러올 수 있습니다. ( 파이썬은 다양한 라이브러리를 호출해서 해당 라이브러리에서 제공하는 기능을 활용할 수 있게 하는 툴입니다. Pandas는 데이터 편집/분석에 일반적으로 사용되는 라이브러입니다.) 1. Pandas 불러오기 [ import 라이브러리명 as 명칭 ] - as뒤는 입력하는 텍스트는 앞으로 해당 라이브러리를 지칭할 명칭을 부여해주는 기능입니다. (보통은 pandas를 pd로 많이 지칭하는데, 본인이 편한 값을 부여해줘도 무방합니다.) ##Pandas 라이브러리 설치 import pandas as pd 2. 파일 불러오기 [ pd.re.. 이전 1 다음