실전#3 데이터로 알아보는 리그 오브 레전드의 승리 공식(2)
데이터 전처리 과정 cf. 이번 강의는 결론만 보면 이해가 되지만, 과정으로는 살짝 만족스럽지 못했던 강의였다. 이유는 아래에 조금 더 자세하게 데이터 전처리 과정 전에 우선 Multicollinearity를 방지하는 과정부터 시작하자. 특정 변수들 간 상관성이 높아 하나의 변수만 봐도 되는 변수들을 drop 시키도록 하자 df.drop(['gameId', 'redFirstBlood', 'redKills', 'redDeaths', 'redTotalGold', 'redTotalExperience', 'redGoldDiff', 'redExperienceDiff'], axis = 1, inplace = True) gameId : 고유 id 개념이기 때문에 실제 분석에서 변수로서 의미를 지니기 어렵다. redF..