머신러닝은 보통 여러가지로 분류되곤 한다.
여러 가지 머신러닝 기법들이, 어떻게 금융 데이터를 분석하는데 활용되는지
아주 조금! 정리 할 것이다.
인공지능 시간에 배웠던 것들을 잘 활용하여 코드로 구현하는 것 까지 이어서 진행 할 예정이다.
ㅎ_ㅎ
1. Supervised Learning (지도 학습) / Unsupervised Learning (비지도 학습)
1-1. 지도 학습 : Supervised Learning
지도 학습은 한마디로 '정답'이 있는 데이터이다. 수업시간에 활용했던 가장 간단한 예시로는 iris 분류가 있었다.
학습을 할 때 사용했던 표본 데이터 이외의 데이터에 대하여 가장 좋은 예측을 하는 모델을 찾는 것이 목표!
1. 분류 ( Classification)
출력값을 특정 카테고리로 분류한다.
Logistic Regression, Decision Tree, Random Forest 등
: '이진 의사결정'이 주인데, 주가나 물가, 등을 입력으로, 투자를 할지/ 구매를 할 지 등을 결정할 때 많이 사용한다.
2. 회기 (Regression)
입력값이 주어졌을 때, 새로운 데이터에 대한 출력값을 예측한다.
Lasso Regression, KNN 등
: 인플레이션 발생 시, 시장의 반응을 예측할 때 사용될 수 있다.
1-2. 비지도 학습 : Unsupervised Learning
'정답'이 없는 데이터.
데이터들의 공통적 특징을 찾아, 데이터 각각의 구조를 파악하는 것이 목표!
1. 클러스터링 (Clustering)
데이터셋을 N개의 그룹으로 분류한다.
K-means, K-Centroid, K-Medoid 등
: 데이터를 기반으로, 금리의 상승/하락, 고변동성/저변동성, 물가의 상승/하락 등을 나눌 수 있다. 정답이 없는 분류 알고리즘 느낌?
2. 팩터 분석 (Factor Analyses)
데이터의 변화?의 원인을 파악하기 위해 사용된다.
금리 변화, 물가 변화 같은 현상의 원인을 찾기 위해 사용된다.
PCA(주성분분석)
: 금리 변화, 물가 변화 같은 현상의 원인을 찾기 위해 사용된다.
Deep Learning은 다음 시간에..
'STUDY > Fintech' 카테고리의 다른 글
퀀트(Quant), 금융 ML (0) | 2021.09.23 |
---|---|
[2021] Fintech 기술 트렌드 및 용어 정리 (0) | 2021.09.05 |
댓글