혼동행렬

머신러닝에서 모델의 성능을 평가하기 위한 지표입니다. actual은 실제 정답이고 predicted는 모델이 예측한 결과입니다.
- True Positive(TP) : 실제 True인 정답을 True라고 예측 (정답)
- True Negative(TN) : 실제 False인 정답을 False라고 예측 (정답)
- False Positive(FP) : 실제 False인 정답을 True라고 예측 (오답)
- False Negative(FN) : 실제 True인 정답을 False라고 예측 (오답)
1. 정밀도 (precision)

모델이 True라고 분류한 것 중에서 실제 True인 것의 비율
2. 재현율 (recall)

실제 True인 것 중에서 모델이 True라고 예측한 것의 비율
이러한 지표들이 있어야하는 이유는 정확도라는 지표만으로는 설명하기 부족한 것들이 많기 때문입니다. 정확도는 전체에서 정답을 맞힌 비율인데 예를 들어, 대장암 환자가 100명 중에 1명이 나타나는데 모델이 100명 모두 대장암 환자가 아니라고 예측한다면 99번의 정답을 맞히게 됩니다. 그러면 정확도는 99%로 말도 안되는 예측을 했음에도 높은 지표가 나옵니다. 그래서 다른 지표들로 모델을 평가하는 일은 이러한 잘못된 해석을 하지 않게 도와줍니다.
'AI study > Machine learning' 카테고리의 다른 글
| Active learning (3) | 2024.10.18 |
|---|