Tratamiento de clases desbalanceadas con el método del cubo en problemas de credit scoring a través de la minería de datos

  • Mauricio BeltránPascual Junta de Castilla y León
  • Juan Antonio Vicente Virseda Universidad Nacional de Educación a Distancia
Palabras clave: método del cubo, credit scoring, minería de datos, coste de clasificación

Resumen

En este artículo se aborda la forma de aplicar el método de muestreo denominado “Método del cubo” en problemas de credit scoring con la finalidad de poder mejorar la precisión de los modelos predictivos que se obtengan. Este método permite garantizar un óptimo equilibrio de las muestras cuando se trabaja con bases de datos cuyas clases de la variable dependiente están altamente desbalanceadas. Utilizando dos muestras de datos bancarios reales, se realiza un estudio comparativo de los mejores modelos obtenidos con diversos métodos de minería de datos aplicados a las bases de datos originales frente a las balanceadas. Finalmente, se concluye que la capacidad predictiva de los algoritmos de clasificación es más precisa y que los modelos utilizados reducen el coste económico de la clasificación cuando se equilibran las muestras.

Publicado
2019-09-30