AI/머신러닝과 딥러닝
Predict modeling process
Predict modeling process
2021.09.03라이브러리 import Dataset check (null) Exploratory Data Analysis 각 feature(column)분석 상관관계 파악 visualization tool을 이용해서 인사이트 도출 Feature engineering (improve model performance) ex) one hot encoding 클래스로 나누거나 구간으로 나누거나, 텍스트 데이터 처리 모델 생성 모델학습, 예측 모델 평가 (정확도를 따질 수도 있고, RMSE등 평가방식은 여러가지)
과적합(overfitting) 방지를 위한 데이터셋 분리
과적합(overfitting) 방지를 위한 데이터셋 분리
2021.08.12머신러닝 / 딥러닝 모델을 학습시키기 위해서는 데이터셋이 필요하다. 이 데이터셋은 어떻게 구성하고 활용할까? sickit-learn의 model_selection 패키지 안에는 학습세트와 테스트세트를 분리할 수 있는 모듈이 있다. train_test_split 모듈에 대해서 알아볼 것이다. train, validation, test 데이터셋 머신러닝, 딥러닝 모델을 피팅시키기 위해서는 데이터셋을 크게 세 가지로 분리한다. training set(학습 데이터셋) : 모델의 학습을 위해 사용되는 데이터 validation set(검증 데이터셋) : 모델의 학습 과정에서 성능을 확인하고, 하이퍼 파라미터를 튜닝하는데 사용된다. 여러가지 하이퍼 파라미터로 생성된 모델들 중에 어떤 것이 성능이 좋은지 평가한다. ..
컴퓨터 비전 (Computer Vision with Data-Centric)
컴퓨터 비전 (Computer Vision with Data-Centric)
2021.08.06컴퓨터 비전이 뭐야? 컴퓨터 비전(computer vision)이라는 단어에서 알 수 있듯, 사람의 시각과 유사한 시스템 구조를 통해 컴퓨터가 사람처럼 물체나 상황을 식별하고 해석할 수 있도록 하는 분야이다. 컴퓨터 비전에서 다루는 데이터는 이미지와 이미지 내부의 텍스트를 인지하는 영역 뿐만 아니라 Video와 3D Video도 포함된다. Video는 image Frame의 합이기 때문이다. 스마트폰이 대중화되면서 image뿐만 아니라 video data가 기하급수적으로 증가했다. 이는 컴퓨터 비전이라는 연구분야의 필요성을 증대시켰다. 한 애널리스트의 발표에 따르면, 2021년 컴퓨터 비전에서 AI 시장 규모는 159억 달러로 추정하였고, 2026년까지 해당 시장은 513억달러에 이를 것으로 예상된다. ..