실전#1. 데이터 분석으로 심부전증을 예방할 수 있을까(2)
데이터를 확보했으니, 다음 단계는 EDA 과정이다. 우선 데이터 확보 후 기본적으로 진행하는 절차들은 아래 3가지 코드가 될 것 같다 # 데이터 기본 확인 df.head() # 각 컬럼별 null 존재, 타입, 전체 count df.info() # 각 컬럼별 기초 통계정보 (count, mean, std, min, 25%, 50%, 75%, max) df.describe() 1) df.head() 를 통해 : 기본적인 데이터의 형태를 알 수 있다. 특정 컬럼에 어떤 값들이 들어와있는지 등 2) df.info() 를 통해 : 컬럼별 정보를 확인하면서 null(결측치)가 존재하지는 않는지, 컬럼을 정의한 Type은 무엇인지 등을 알 수 있다. 3) df.describe() 를 통해 : 컬럼별 기본적인 통계 ..