class imbalanced problem이란(14:13)
IR (class imbalanced ratio) = # of majority class / # of minority class
class imbalanced problem 이란?
- 모델이 소수의 데이터를 무시하는 현상
- oversampling 기법 통해 minority 데이터를 부풀려서 사용가능
class imbalanced problem 에서 사용하는 모델 성능 지표
- G-mean, F1 measure
- 정밀도 : 얼마나 잘 작동했는지 보여주는 지표
- 재현율 :
- 특이도 :
- ROC curve : 가로축 1-특이도, 세로축을 재현율로 하여 시각화한 그래표
- AUC : ROC curve의 면적
class imbalanced problem 해결방법 (10:45)
resampling mehtod
over-sampling (up) : 소수 데이터를 부풀리는 법
cost-sensitive learning
class의 오류 분석에 대한 cost 의 가종
'DS > fast campus daily report' 카테고리의 다른 글
7.24 (딥러닝 인공지능) anaconda 활용 및 단축키, tensor 이해하기 (0) | 2020.07.24 |
---|---|
7.19 (머신러닝과 데이터분석) oversampling 기법, SMOTE변형 기법들 (0) | 2020.07.19 |
7.15 (머신러닝과 데이터분석) k-means 1.clustering, 2.k-means clustering, 3.최적의 k (0) | 2020.07.15 |
7.14 (데이터엔지니어링) 터미널에서 데이터베이스 연결하기, mysql-데이터베이스 연결하기, mysql 데이터베이스안에서 테이블 생성, 엔터티 관계도란? (0) | 2020.07.14 |
7.13 (딥러닝/인공지능)챕터 소개, 전체 구조 및 학습 과정, 딥러닝 용어- (0) | 2020.07.14 |