728x90 STUDY/[AI] ML4 Unsupervised Learning - Clustering 부분 발표 자료 보호되어 있는 글 입니다. 2021. 11. 21. Linear Classification, Logistic Regression [ Linear Classification ] Classification 이란? - training set의 output(target) variable이 범주 형태로 주어지는 것. - linear classification - 일차 함수, 즉 직선 형태의 boundary를 이용해 data를 분류하는 model ex) 위의 binary classification 같은 경우, 두 class data의 범주를 나누어주는 경계인 'Decision boundary'를 찾는것이 목표. ex) Decision boundary를 알고 있다면, test data 'x'에 따른 target class를 예측할 수 있다. Linear Classification에서 output variable을 찾는 방법 - Threshol.. 2021. 11. 20. ML Basic 정리 [Step of ML] (1) Training(learning) : Model(NN, DT 등)을 Training Dataset에 대해서 fitting시키는 과정 (2) Test(Inference) : Training을 통해 데이터에 가장 잘 맞는 모델을 찾은 후, 학습한 모델을 통해 Test Dataset에 대해서 성능을 측정하는 과정 [Dataset] - 소규모 data의 경우 6:2:2, 대규모 데이터의 경우 98:1:1의 비율을 갖는다. (1) Training Dataset : 학습에 사용 (2) Validation Dataset : 모델 선택에 사용. 여러 모델의 성능을 측정하여 최종 모델을 선택함 (3) Test Dataset : 최종 모델에 대한 성능 측정에 사용 [교차검정법 (k- fold.. 2021. 11. 20. 쏘카 Socar x 멋사 AI 엔지니어 육성 부트캠프 참여! [1주차, 2주차 1/2] 4학년때 수강했던 인공지능 과목에서 팀 프로젝트를 진행한 적이 있다. 큰 틀은 고객 구매 정보 데이터를 기반으로 사기 거래를 예측하고, 이를 기반으로 고객을 분류한 뒤 고객에 맞는 물품 구매 추천시스템을 개발하는 것 이었지만, 막상 내가 개발에 주도적으로 참여한 부분은 고객 분류 및 추천시스템 개발 부분, 즉 classification, clustering, user/item based collaborative filterigng.. 등을 구현하는 부분이었다. (그 당시 내가 자신있던 부분이어서 선택하였다.) 지금 드는 생각은, 아... 사기 탐지 부분을 맡아서 할 걸 그랬다. 싶은 부분이 있었다. Decision Tree와 Random Forest, Neural network, 여러 층의 hidden .. 2021. 10. 22. 이전 1 다음 728x90