데이터 마이닝 모델링
- 데이터 마이닝 모델링은 통계적 모델링이 아니므로 지나치게 통계적 가설이나 유의성에 집착하지 말아야 함
- 충분한 시간이 있으면 다양한 옵션을 줘서 시도해도 되지만, 그렇지 않은 경우 일정 성과가 나오면 해석과 활용 단계로 진행할 수 있도록 의사결정 해야함
- 분석 데이터를 학습 및 테스트 데이터로 6:4, 7:4, 8:2 비율로 상황에 맞게 실시
- 성능에 집착하면 분석 모델링의 주 목적인 실무 적용에 반하여 시간을 낭비할 수 있으므로 훈련 및 테스트 성능에 큰 편차가 없고 예상 성능을 만족하면 중단해야 함
데이터 마이닝 모델링 평가 기준
- 정확도
- 정밀도
- 디렉트 레이트
- 리프트
시뮬레이션 평가 기준
- Throughput
- Average Waiting Time
- Average Queue Length
- Time in System