반응형

캐글의 타이타닉 데이터를 이용해서 Data analysis의 전체적인 과정을 되짚어 보는 시간을 가졌다.

Data analysis는 크게 5가지 과정으로 나눌 수 있다.

  • Data set check

  • EDA(Exploratory Data Analysis)

  • Feature engineering

  • Model development - Machine learning

  • Machine learning prediction - feature importance and prediction on test set


베이직한 Data analysis 과정을 살펴보자.

 


Data set check ▶ EDA ▶ Feature engineering ▶ Model development ▶Machine learning prediction
5가지 과정을 잊지말자.

해당 코드를 공유한다.
https://github.com/mgkim-developer/30-Days-of-ML-with-Kaggle/blob/main/data-analysis-for-titanic.ipynb

 

GitHub - mgkim-developer/30-Days-of-ML-with-Kaggle: 30 Days of ML with Kaggle

30 Days of ML with Kaggle. Contribute to mgkim-developer/30-Days-of-ML-with-Kaggle development by creating an account on GitHub.

github.com

 

반응형