AI
30 Days of ML with Kaggle [Day 13]-Pipelines, Cross-Validation
30 Days of ML with Kaggle [Day 13]-Pipelines, Cross-Validation
2021.08.17Day13이다. 오늘 알아 볼 내용은 아래와 같다. Today's Assignment - day 13 Read this tutorial (from Lesson 4 of the Intermediate ML course) Complete this exercise (from Lesson 4 of the Intermediate ML course) Read this tutorial (from Lesson 5 of the Intermediate ML course) Complete this exercise (from Lesson 5 of the Intermediate ML course) Pipelines Introduction 파이프라인은 데이터 사전 처리 및 모델링 코드를 체계적으로 유지하는 간단한 방법이다. 특히..
30 Days of ML with Kaggle [Day 12]-Introduction, Missing Values, Categorical Variables
30 Days of ML with Kaggle [Day 12]-Introduction, Missing Values, Categorical Variables
2021.08.16오늘은 Day 12 이다. Intro to ML을 끝내고, Intermediate ML course을 시작한다. Today's Assignment - day 12 Read this tutorial (from Lesson 1 of the Intermediate ML course) Complete this exercise (from Lesson 1 of the Intermediate ML course) Read this tutorial (from Lesson 2 of the Intermediate ML course) Complete this exercise (from Lesson 2 of the Intermediate ML course) Read this tutorial (from Lesson 3 of th..
Kaggle Intro to Machine Learning Certificate
Kaggle Intro to Machine Learning Certificate
2021.08.14
30 Days of ML with Kaggle [Day 11]-Machine Learning Competitions
30 Days of ML with Kaggle [Day 11]-Machine Learning Competitions
2021.08.14Day 11이다! 오늘은 intro to ML 의 lesson 7이다. Today's Assignment - day 11 Read this tutorial (from Lesson 7 of the Intro to ML course) Complete this exercise (from Lesson 7 of the Intro to ML course) Machine Learning Competitions 머신러닝 대회는 데이터사이언스 기술을 향상시키고, 진행 상황을 측정하는 좋은 방법이다. 다음 연습에서 House Prices Competition for Kaggle Learn Users. 의 결과를 작성하여 제출해라. Housing Prices Competition for Kaggle Learn Users w..
30 Days of ML with Kaggle [Day 10]-Underfitting and Overfitting, Random Forests
30 Days of ML with Kaggle [Day 10]-Underfitting and Overfitting, Random Forests
2021.08.13오늘은 Day10이다! 오늘 Assignment를 잘 수행하면, 1/3이 지난다! 오늘도 열심히 해보자! Today's Assignment - day 10 Read this tutorial (from Lesson 5 of the Intro to ML course) Complete this exercise (from Lesson 5 of the Intro to ML course) Read this tutorial (from Lesson 6 of the Intro to ML course) Complete this exercise (from Lesson 6 of the Intro to ML course) 오늘은 Underfitting and Overfitting이라는 주제와, Random Forests mod..
과적합(overfitting) 방지를 위한 데이터셋 분리
과적합(overfitting) 방지를 위한 데이터셋 분리
2021.08.12머신러닝 / 딥러닝 모델을 학습시키기 위해서는 데이터셋이 필요하다. 이 데이터셋은 어떻게 구성하고 활용할까? sickit-learn의 model_selection 패키지 안에는 학습세트와 테스트세트를 분리할 수 있는 모듈이 있다. train_test_split 모듈에 대해서 알아볼 것이다. train, validation, test 데이터셋 머신러닝, 딥러닝 모델을 피팅시키기 위해서는 데이터셋을 크게 세 가지로 분리한다. training set(학습 데이터셋) : 모델의 학습을 위해 사용되는 데이터 validation set(검증 데이터셋) : 모델의 학습 과정에서 성능을 확인하고, 하이퍼 파라미터를 튜닝하는데 사용된다. 여러가지 하이퍼 파라미터로 생성된 모델들 중에 어떤 것이 성능이 좋은지 평가한다. ..