oversampling 기법(8:55)
class imbalanced problem 해결위한 방법
Resampling mehtod
- over sampling : 소수의 데이터를 부풀리는 방법
- under sampling : 다수의 데이터를 줄이는 방법
- hybrid resampling : over & under 결합해서 사용
cost-sensitive learning
SMOTE변형 기법들(10:36)
SMOTE
두 point를 연결하는 segment상에 존재하는 data를 random sampling
BLSMOTE (borderline SMOTE)
- 정확하게 borderline을 찾는다는 보장이 있어야 한다.
DBSMOTE(DBSCAN SMOTE)
- Minority data에 대하여 DBSCAN cluster
- 경로가 뚜렷하게 보인다?
데이터마다 좋은 알고리즘(잘 맞는) 이 다르다.
'DS > fast campus daily report' 카테고리의 다른 글
7.25 (딥러닝 인공지능) numpy 기초 - 1 (0) | 2020.07.25 |
---|---|
7.24 (딥러닝 인공지능) anaconda 활용 및 단축키, tensor 이해하기 (0) | 2020.07.24 |
7.18 (머신러닝과 데이터분석)class imbalanced problem>imbalanced problem 해결방법 (10:45) (0) | 2020.07.19 |
7.15 (머신러닝과 데이터분석) k-means 1.clustering, 2.k-means clustering, 3.최적의 k (0) | 2020.07.15 |
7.14 (데이터엔지니어링) 터미널에서 데이터베이스 연결하기, mysql-데이터베이스 연결하기, mysql 데이터베이스안에서 테이블 생성, 엔터티 관계도란? (0) | 2020.07.14 |