Introducción a la Minería de Datos para construir Sistemas de Análisis de Riesgo Crediticio de Consumo.

 

 

 

 

Roberto Araya Schulz

AutoMind

www.automind.cl

 

 

 

 

 

 

Tabla de Contenidos

 

 

 

Introducción

 

Productividad

Calidad

Oportunidades: Tecnología y Metodologías

 

 

Principales Desafíos en la Implementación de Tecnologías Crediticias

 

Conocimientos y Capacitación

Calidad de la Información

Construcción de los scoring

 

 

Anexo: Diccionario de Principales Términos

 


Introducción

 

 

El crédito de consumo ha experimentado en toda  Latinoamérica un fuerte crecimiento en los últimos años. Bancos, financieras, administradoras de tarjeta y tiendas de departamento colocan un volumen creciente de recursos en créditos de consumo. Estos representan una parte significativa y muchas veces central del negocio de bancos e instituciones financieras.

 

El carácter masivo y la rapidez de las decisiones son las características claves que definen las estrategias y tácticas del negocio. Por consiguiente, el manejo eficiente de un gran volumen de información para la evaluación rápida y precisa del riesgo, determina la rentabilidad y supervivencia de las instituciones.

 

Desde un tiempo a esta parte, el proceso de crédito ha experimentado un gran incremento en agilidad. La fuerte competencia ha conducido a una mayor eficiencia del servicio. Lamentablemente, en muchas ocasiones esto ha significado un aumento considerable en la mora, obligando a la desaparición de algunos actores.

 

Sin embargo, nuevas metodologías y tecnologías de evaluación y gestión del riesgo crediticio permiten obtener la productividad requerida sin deteriorar la calidad de la cartera. En definitiva, los dos factores claves de la banca de consumo son productividad y calidad de las evaluaciones y decisiones.

 

 

Productividad

 

Existen diferentes mediciones de productividad. Una de las principales es el número de colocaciones por empleado o por ejecutivo. Es importante que las instituciones conozcan este indicador y hagan benchmarking con otras instituciones del país y extranjeras. La comparación permite conocer potenciales futuras amenazas y planificar estrategias de desarrollo del sector.

 

 

Calidad

 

Básicamente, la calidad está determinada por la mora. Es muy importante que el monitoreo no sólo sea global, sino por producto y por sector de actividad económica. Un seguimiento segmentado permite ayudar a corregir a tiempo potenciales dificultades. 

 

 

Oportunidades: Tecnología y Metodologías

 

Las diferentes alternativas metodológicas y tecnológicas de evaluación y seguimiento del riesgo crediticio pueden clasificarse en cuatro grupos:

 

Alternativa tradicional. La metodología tradicionalmente utilizada en las instituciones financieras consiste en que los ejecutivos de cuenta evalúan solicitudes de crédito utilizando su propia experiencia y basándose implícitamente en guías, circulares y manuales publicados y divulgados por la gerencia de riesgo o alguna gerencia equivalente. Paralelamente, se realizan con cierta frecuencia cursos y seminarios de riesgo crediticio para asegurar una cierta homogeneidad y calidad de las decisiones.

 

Este método tiene las siguientes dificultades:

 

    Pobre desempeño: la experiencia de la mayoría de los ejecutivos de cuenta es limitada, lo cual significa producir decisiones heterogéneas, y muchas de ellas con un gran grado de imprecisión.

 

            Inflexibilidad: se requiere experiencia de varios años antes que los ejecutivos se desempeñen bien. Por esta razón, este método reacciona lento a los cambios en la población de solicitantes de créditos.

 

            Inconsistencia: Diferentes ejecutivos poseen estándares diferentes.

 

    Baja eficiencia: Evaluar solicitudes consume tiempo e involucra también a personal experimentado de jerarquía superior.

 

·        Imposibilidad de monitoreo efectivo: La gran heterogeneidad de las decisiones realizadas y la imposibilidad de conocer los criterios efectivamente utilizados, hace imposible efectuar un proceso de moniteoreo y retroalimentación constante para mejorar futuras decisiones crediticias.

 

Esta alternativa es la que tradicionalmente se ha utilizado en la banca de personas. Típicamente a personas de nivel medio alto, de bajo riesgo, y en donde los altos márgenes permiten operar en forma rentable aún cuando el servicio es muy personalizado y con muy baja productividad. Esta alternativa no es rentable en la banca de consumo. Por otra parte, el crecimiento de la competividad ha obligado hoy en día a que incluso la banca de personas se tecnologice y automatice para aumentar significativamente la productividad.

 

Segunda alternativa: matrices y tablas. Las limitaciones de la alternativa tradicional unidas a una creciente competividad ha obligado a las instituciones a buscar alternativas más eficientes. La más común es el diseño y uso de matrices, tablas o métodos de puntajes. Típicamente estos se desarrollan en base a la experiencia de ejecutivos con años de actividad en el sector y basándose en plantillas y/o modelos de otras instituciones del país o del extranjero. Ocasionalmente también se realizan estudios estadísticos sobre capacidad de pago de algunos segmentos de la población, lo cual orienta a los diseñadores a realizar ajustes a algunos criterios incluidos en las matrices.

 

Si bien esta alternativa ya es un progreso respecto a la anterior, todavía puede mejorarse enormemente. Sin embargo, su aplicación requiere un seguimiento bien controlado pues en ocasiones puede llevar a deteriorar la calidad de las decisiones crediticias.  Las principales debilidades son:

 

 

            Potencial peligro de pobre desempeño: es necesario controlar y cuantificar el efectivo cumplimiento de los criterios de las matrices y la potencial manipulación (maquillaje) de datos para conseguir puntajes aceptables. Se recomienda cuantificar periódicamente el porcentaje de exepciones y realizar muestras periódicas para determinar por cada ejecutivo la calidad de la información que él ha utilizado.

 

            Mediana flexibilidad: nuevos criterios significa un proceso de lenta asimilación que requiere un largo tiempo hasta que los ejecutivos los apliquen adecuadamente. Por lo tanto, este método reacciona lento a los cambios en la población de solicitantes de créditos.

 

    Escasa retroalimentación: al carecer de un sistema automático de seguimiento de la efectividad de las políticas diseñadas, es muy difícil establecer un esquema de rediseño permanente y basado en criterios sólidos. Los cambios que típicamente se proponen, se basan en experiencias personales sin una validación sistemática.

 

 

Una tercera alternativa es automatizar el proceso de crédito, convirtiendo la matriz o tabla de puntajes a un programa computacional. Típicamente esto se hace mediante alguna macro en Excel o algún otro software. Así, con la ayuda del computador es posible llegar a la toma de decisión instantánea, en el mismo momento cuando el cliente solicita el crédito. El computador accede a la información de moralidad, información demográfica, información sectorial, información sobre endeudamiento del cliente e información sobre la operación, y el sistema ayuda al ejecutivo a discriminar si el cliente es sujeto de crédito. De esta manera la uniformidad de criterios y la rapidez del servicio quedan completamente garantizados.

 

Sin embargo, las principales limitaciones son:

 

            Desconocimiento de precisión: la sola conversión de una tabla de decisiones a un mecanismo computacional no garantiza la precisión del instrumento. Aún más, al ser éste un mecanismo automático y críptico puede perpetuar malos criterios y en ocasiones aumentar la mora. Es necesario implementar metodologías que permanentemente evalúen la precisión de las evaluaciones.

 

            Desajustes por cambio macroeconómicos o sectoriales: aún cuando el sistema se haya inicialmente diseñado considerando criterios validados basados en información acumulada es necesario establecer procedimientos de seguimiento y ajustes permanentes.

 

 

Cuarta alternativa: construcción y ajuste permanente de sistema de evaluación de riesgo crediticio (credit scoring) basado en tecnologías de minería de datos. Esto significa construir y mantener un sistema de información orientado a facilitar la búsqueda de perfiles de clientes riesgosos y un software de análisis del comportamiento de pagos de la cartera de clientes especializado en detectar y caracterizar clientes de alto riesgo. Las tecnologías típicamente utilizadas son: análisis discriminante, inducción de árboles de decisión y redes neuronales. Todas ellas dan lugar a credit scoring basados en minería de datos.

 

Es importante señalar que es difícil establecer rápidamente la diferencia entre esta alternativa y la tercera alternativa. Los credit scoring construidos se ven iguales en apariencia. Sin embargo, las tecnologías subyacentes son radicalmente diferentes y las diferencias en desempeño son enormes. Esta confusión está muy difundida. Todavía muchos banqueros no comprenden la diferencia y creen tener un credit scoring de última tecnología cuando todo lo que han implementado es una matriz computacional.

 

Dada la sofisticación de los métodos estadísticos de análisis de riesgos requeridos para la construcción satisfactoria de estos sistemas, éstos son típicamente construidos por proveedores externos altamente especializados.

 

La principal dificultad de los credit scoring construidos en base a minería de datos, es la necesidad de contar con personal capacitado en las tecnologías de minería de datos aplicada a análisis de riesgo que pueda verificar periódicamente la validez de estos sistemas: tantos aquellos en uso como los con nuevas modificaciones.


 

Principales Desafíos en la Implementación de Tecnologías Crediticias

 

 

Presentamos aquí los principales desafíos que experimentan las instituciones al introducir tecnologías de evaluación de riesgo crediticio para créditos de consumo. Las posibilidades de cometer errores son muchas y muy variadas. El plazo típico para introducir estas tecnologías es de un año a dos, pero la asimilación completa puede tomar hasta cuatro años.  A continuación se describen estos desafíos, todo lo cual respalda los cuestionarios de campo sugeridos para las visitas de inspección.

 

 

 

Conocimientos y Capacitación

 

 

·        Conocimientos de Modelos Estadísticos. Hay tres problemas básicos en el conocimiento de modelos estadísticos.

 

·        Por una parte la formación estadística básica del personal no es óptima. La estadística es una especialización que todavía no está muy difundida, por lo que el personal profesional de las instituciones a lo más tuvo uno o dos cursos de estadística en los estudios universitarios para obtener su título profesional.

 

·        Por otra parte, los conocimientos adquiridos en la Universidad están ya olvidados. Lo pocos conocimientos adquiridos no son constantemente utilizados, por lo que muy probablemente están ya olvidados.

 

·        Finalmente, los conocimientos estadísticos del personal no se ajustan a las necesidades para la construcción de modelos de scoring crediticio. No es que estén obsoletos, si no que lamentablemente en las universidades latinoamericanas los conocimientos de los profesores son más bien teóricos, sin ninguna experiencia en problemas de modelos estadísticos para créditos. Esto significa que a los estudiantes no se les enseña los contenidos necesarios para luego poder construir credit scorings.

 

 

·        Conocimientos de Parámetros Principales. Existe una serie de dificultades para seleccionar los parámetros que inicialmente serán analizados y considerados en un modelo. Es necesario tener conocimientos sobre los siguientes parámetros y alguna experiencia sobre sus rangos típicos y dificultades de recolección:

 

·        Parámetros demográficos. Los típicos son sexo, profesión, educación, edad, cargas, antigüedad en el empleo, ingresos, etc. Es muy importante diferenciar los parámetros del individuo de los del grupo familiar, así como múltiples posibilidades de errores o malas clasificaciones. 

 

·        Parámetros de moralidad crediticia. Estos corresponden a información sobre comportamiento crediticio del cliente. Puede dividirse en dos: dentro de la misma institución o con otras instituciones (financieras u otras). La calidad de la información es crítica, y aquí radica la mayor dificultad. En general, los credit bureaus son nuevos en Latinoamérica por lo que la información es muchas veces inconsistente o contiene errores graves. Finalmente, un malentendido muy difundido es el relacionado con el instante a que se refiere esta información. Según se vaya a construir un credit scoring de iniciación o uno de comportamiento (un behavior), la información se refiere a distintos momentos.

 

·        Parámetros sectoriales. Corresponde al sector económico al que pertenece el cliente. Lamentablemente la clasificación no siempre existe y cuando existe no es siempre consistente. Diferentes empleados y pertenecientes a diferentes niveles son los que  han clasificado los clientes. Adicionalmente, los criterios utilizados no son uniformes y no están claramente documentados.

 

·        Parámetros de comportamiento. Son los parámetros utilizados en sistemas de comportamiento (behaviors). Típicamente corresponden a una ventana móvil con datos como días de mora en los últimos 12 meses previos al mes seleccionado, (o los últimos 6 meses, o 3 meses),  saldo actual sobre el saldo máximo en los últimos 12 meses, etc. Estos parámetros no son utilizados en sistemas de iniciación, pero en los de comportamiento son los críticos. Las dificultades se deben a vacíos y errores en los que la mora de un cliente puede de un mes a otro saltar más de 30 días. Falta de experiencia en estos potenciales errores pueden hacer que se construya un bahavior sobre información errónea.

 

·        Parámetros de seguimiento y de clasificación entre buenos versus malos clientes. Las bases de datos que mantiene el Departamento o Gerencia de Sistemas con los pagos de los clientes no han sido diseñadas para hacerles minería de datos. Por esta razón hay muchos vacíos, información superflua, y no cruza con la información disponible en carpetas. Falta de conocimiento y experiencia en estas definiciones pueden demorar un proyecto en varios meses.

 

 

·        Conocimientos de muestreo. La teoría del muestreo es una materia compleja dentro de la estadística. Adicionalmente, no se enseña en las universidades y, lamentablemente, cuando se llega a enseñar en la Universidad no se le dedica más que un par de clases. Otra dificultad adicional es que existen en el muestreo una serie de dificultades prácticas que no entran como parte de los contenidos típicamente enseñados.

 

·        Definición de la muestra. No es simple determinar el tamaño de la muestra, ni la definición de buen versus mal cliente. Típicamente debe además construirse una muestra para testeo, cosa que muy raramente se hace. Inexperiencia en estos temas puede hacer que los scoring construidos sean definitivamente malos, o en el mejor de los casos, que un tercero se dé cuenta de los problemas y sea necesario comenzar de nuevo con el proyecto de construcción de un scoring.

 

·        Reescalamiento. Esto es materia de gran confusión, pues resultados obtenidos de las muestras deben ser reescalados para su interpretación final. Esto se debe a que en la muestra se trabajan con una proporción de muchos más malos clientes que en la población general. Inexperiencia en este tema es causa de que los análisis sean mal interpretados y se construyan scoring completamente errados.

 

·        Procedimientos de muestreo. Es importante conocer los diferentes algoritmos de muestreo, así como los algoritmos que pueden llenar vacíos cuando la información que falta es reducida.

 

·        Verificación de la muestra. Es muy importante ejecutar procedimientos y cálculos para asegurarse que la muestra es representativa. Por ejemplo, graficar buenos y malos por zona geográfica, edad, monto del crédito, etc.

 

·        Necesidades de recolectar información. En muchos casos es necesario recolectar información adicional que no está en carpetas o en forma digital. Es importante prever esta posibilidad y conocer cuándo es necesario recolectar información adicional así como los cuidados que se deben tener y los plazos típicos que esta acción adicional implica.

 

·        Muestras digitales versus muestras de carpetas. Es necesario saber determinar cuándo se puede utilizar información digital y cuándo es inevitable recolectar carpetas físicas. También es importante conocer las dificultades típicas para recolectar información de carpetas. Esto incluye: personal adecuado, construcción de un programa ingresador, administración de la digitación, verificación de la calidad de la información digitada, planes y acciones en caso de carpetas perdidas.

 

·        Interpretación de resultados. Estos conocimientos son los más difíciles de adquirir y dominar. Se requiere una conjunción de habilidades y conocimientos matemáticos y estadísticos junto con experiencia y conocimientos en créditos de consumo. Es importante destacar que no basta con tener personal que conozcan por una lado un aspecto y otros que dominen el otro. Es necesario alguien que maneje bien ambos aspectos: el estadístico y el crediticio.

 

 

·        Conocimientos de Testeo. Aquí hay una serie de procedimientos y algoritmos que es muy común que los principiantes e inexpertos no sólo no los hagan adecuadamente si no que en muchos casos ni siquiera los consideren. Aún cuando la institución financiera externalice todo el proceso de construcción de un scoring o un behavior, y lo haga con terceros muy experimentados, no puede dejar de hacer tests independientes que le aseguren la calidad del modelo y que este será mejor que con los métodos y prácticas que ha venido utilizando hasta ahora. Los principales conocimientos de testeo son:

 

·        Muestreo para el testeo. Este muestreo es diferente del muestreo para la construcción del scoring y es muy común que los principiantes e inexpertos no lo hagan (y ni siquiera lo planifiquen).

 

·        Seguridad y confidencialidad. Es esencial que los constructores del scoring no tengan acceso a la información de testeo y deba entonces existir procedimientos seguros para evitar el escurrimiento de información.

 

·        Técnicas de comparación. Toda prueba con una muestra independiente no tiene la misma predictibilidad que con los datos con que se construyó el scoring. Es importante saber comparar resultados y conocer métodos de medición y comparación entre diferentes modelos.

 

 

·        Conocimientos de Implementación. Aún cuando se haya desarrollado un scoring estadísticamente sólido y con un buen poder predictivo, muchos proyectos fallan en la parte de implementación final. Aquí se lista una serie de conocimientos necesarios para minimizar este riesgo.

 

·        Integración de la información. En la implementación final hay que conocer las diferentes fuentes de información que se deben integrar en tiempo real. Esto involucra varios desafíos por formatos, protocolos, tiempos de respuesta, etc. Cada uno de estos temas involucra diferentes personas y significan tiempos y retrasos que a veces son muy significativos (llegando incluso a ser varios años).

 

·        Problemas de comunicación. Es necesario prever dificultades de comunicación con las oficinas, sobre todo con aquellas en zonas remotas y conocer los inconvenientes técnicos que ello involucra. En caso de problemas cuya solución signifique plazos muy largos hay que prever planes de introducción paulatina y procedimientos para manejar el proceso crediticio en una etapa de transición donde algunas oficinas estarán completamente automatizadas y otras con procedimientos antiguos.

 

·        Integración de software en diversas plataformas. Diversas bases de datos están normalmente en computadores diferentes y en lenguajes de programación distintos.

 

·        Puestas en marcha. Es importante prever y planificar cuidadosamente marchas pilotos y medir su impacto tanto técnico (informático y crediticio) como organizacional (roles, nuevos procedimientos, etc.).

 

·        Conocimientos de cambios organizacionales. Aún después de una cuidadosa y exitosa implementación, varios scorings y behaviors terminan sin usarse o con un porcentaje muy bajo de utilización. Conocer estas dificultades y cómo administrarlas es muy importante. Las principales son:

 

·        Nuevas funciones y cargos. El uso de scoring involucra la creación de nuevos cargos. Algunos de estos cargos son: capacitador de ejecutivos, soporte, responsable del monitoreo del scoring, etc.

 

·        Redefiniciones de responsabilidades. Es importante conocer las nuevas responsabilidades del gerente de riesgo o crédito, y las nuevas necesidades de diálogo permanente con sistemas y con la gerencia comercial.

 

·        Cambios en organigrama. Muchas veces la implementación final de un scoring involucra cambios de poder. Esto debe conocerse de antemano y quedar claramente explicitado y debidamente planificado.

 

·        Reingeniería del crédito. El proceso completo de introducir scoring y behaviors significa una reingeniería del proceso de crédito. Nuevos performances deben lograrse, nuevas interrelaciones aparecen y viejas prácticas se modifican y desaparecen. Conocer cómo manejar la transición y cómo combatir las inercias es clave para el éxito definitivo.

 


 

Calidad de la Información

 

 

Aquí se presentan muy rápidamente los principales problemas con la calidad de la información. Estos problemas son muy típicos en la banca latinoamericana, pues está recién comenzando a introducir las tecnologías de minería de datos. La calidad actual es suficiente para las operaciones tradicionales de la banca, pero insuficiente para las demandas de precisión que requieren los credit scoring. En el período de transición que está experimentando la banca actualmente es muy importante prestar atención a la calidad de la información y desarrollar planes remediales para depurar la información.

 

 

·        Vacíos en la información.

 

·        Inexistencia de ciertos registros. En muchas bases de datos de  clientes existen lagunas donde registros completos (carpetas completas) han desaparecido. Esto dificulta el análisis cuando no se puede determinar si estas inexistencias corresponden a buenos o malos clientes o si está desproporcionadamente cargado para uno de los dos lados.

 

·        Campos sin información. Adicionalmente a la inexistencia de registros completos pueden existir campos (edad, ingreso, etc.) que estén casi vacíos. Si es así hay varias posibilidades de acción, pero todas requieren esfuerzos no despreciables, plazos adicionales y cuidadosas metodologías.

 

 

·        Formatos

 

·        Diversas bases de datos están codificados en distinta forma, o en distintos sistemas de administración de la información.

 

·        Otras veces los campos están en forma de texto libre (por ejemplo, ciudad ). Todo esto requiere un trabajo de preprocesamiento no despreciable que puede tomar varios meses.

 

 

·        Campos mal codificados. Diferentes codificaciones de fechas, información nula reemplazadas por ceros u otros valores (por ejemplo, clientes con 0 años de edad), etc.

 

 

·        Información errada. Esto va desde información corrida que corresponde a otros campos, a errores por interpretación del significado de nombre de variable o valores escritos en forma muy resumida o críptica, hasta errores en el salto de valores que lógicamente no son posibles (por ejemplo, un cliente pasa de un mes a otro con un salto en los días de mora de más de 30 días). Es necesario realizar diferentes procedimientos de chequeo. Algunas estrategias recomendadas son por ejemplo:

 

·        Diversos gráficos de fácil interpretación. En forma visual es muchas veces mucho más fácil detectar errores.

 

·        Chequeos de ordenes de magnitud

 

·        Comparación entre diversos años y diferentes oficinas

 

·        Chequeos de sumas totales y/o parciales.

 

 

·        Cruces de información repartida en diversas bases de datos. Típicamente estas diversas bases de datos tienen diferentes dueños y, por lo tanto, no conversan entre sí. Esto se puede convertir en una gran pesadilla, que puede alargar un proyecto en varios meses. Los principales problemas son:

 

·        Cruce base de datos de iniciación con base de datos de moralidad. Esto se debe a que la información de iniciación proviene principalmente de solicitudes pero la de moralidad se accesa a proveedores externos y a la SuperIntendencia. Muchas veces las claves para identificar un cliente no coinciden, y a pesar de que la información está en ambos lados no es posible unirlas adecuadamente.

 

·        Cruce base de datos de iniciación con comportamientos de pago. Este es un problema mayor. La información de iniciación proviene principalmente de solicitudes pero la de comportamiento de pagos la lleva sistemas y lo hace con objetivos operacionales muy distintos. Muchas veces las claves para identificar un cliente no coinciden, y a pesar de que la información está en ambos lados no es posible unirlas adecuadamente.

 

 


 

Construcción de los scoring

 

 

A continuación se listan las principales dificultades en la construcción e implementación de los scoring para evaluación crediticia.

 

·        Muestreos para la construcción y el testeo. Las dificultades van desde el tamaño de la muestra, la definición de buenos versus malos clientes, los algoritmos de muestreo, qué hacer en caso de información pedida, algoritmos de llenado de vacíos, decisiones de entrevistas y visitas a clientes, etc.

 

·        Testeo y Validación. Este es el punto más importante y típicamente nunca realizado por los inexpertos. Aún cuando el sistema sea construido por terceros, especializados en credit scoring, es muy importante que la institución financiera tenga una medida independiente y no interesada sobre la capacidad predictiva de los scoring que está recibiendo. En nuestras visitas de diagnóstico en instituciones financieras hemos podido confirmar la indiferencia generalizada por los bancos latinoamericanos sobre este crítico aspecto. Las inspecciones deberían apuntar a determinar si las medidas de testeo están siendo llevadas a cabo, y si no es así a ayudar a las instituciones a asignar los recursos necesarios para implementar los procedimientos de testeo. Es la mejor manera de asegurar que la introducción de estas nuevas tecnologías no produzca deterioros de la calidad de las carteras, comunes en la introducción de estos métodos dada la inexperiencia de las instituciones.

 

·        Monitoreo. Todo sistema se desajusta y, por lo tanto, requiere un monitoreo permanente. Esto significa una inversión en recursos computacionales, sistemas y personal dedicado. La mayoría de los bancos no consideran estos gastos y luego de construido un scoring no están muy dispuestos a hacerlo. El cambio de mentalidad puede tomar bastante tiempo, y entre tanto los peligros de deterioro de la cartera son altos.  

 


 

Anexo: Diccionario de Principales Términos

 

 

 

Algoritmo: Procedimiento de cálculo, que típicamente contiene varias etapas, fórmulas, decisiones u otras acciones.

 

Análisis Discriminante: Método estadístico para encontrar un buen puntaje lineal (de suma ponderada de factores).

 

Arboles de Decisión: Método para calcular puntajes en base a segmentación de la población (por ejemplo: los clientes con buenos antecedentes en la Superintendencia, con más de 5 años en el empleo, con edad más de 30 años y con no más de 3 cargas tienen un puntaje de 975. )

 

Behavior: Scoring para predecir el pago o atraso eventual de un cliente en los próximos 2, 4 o 6 meses de pago.

 

Buen cliente y mal cliente: Juicio al que se llega en común acuerdo entre la dirección del banco, la gerencia comercial y de riesgos, y que define quién es un cliente rentable versus uno no rentable.

 

Comportamiento: Conducta de pago del cliente. Típicamente es la lista de atrasos mes a mes desde que se le otorgó el crédito.

 

Cruce de Información: Cruce entre diversas bases de datos con información de los clientes. Típicamente por una parte está la información de iniciación (al momento de solicitar el crédito), y en otra parte (y otros sistemas) está el comportamiento de pago mes a mes. El cruce siempre es difícil y hay muchos casos de clientes en una base pero no en la otra.

 

Inducción de Arboles de Decisión: Método de construcción de árboles de decisión basado en análisis estadístico.

 

Iniciación: Scoring para evaluar el riesgo crediticio de un solicitante de crédito.

 

KS: medida muy utilizada para cuantificar qué tan buen discriminante es un parámetro. Por ejemplo, si la antigüedad en el empleo tiene un KS de 25 quiere decir que es buen discriminante. KS cercanos a cero son de variables muy mal discriminantes. Los cercanos a 100 son muy buenos. También se puede calcular el KS de un scoring para medir qué tan bueno es. En la práctica el scoring de un modelo de iniciación no pasan de 40 y el de behavior de 60. La definición exacta es la siguiente: porcentaje de malos rechazados por el modelo menos porcentaje de buenos rechazados por el modelo.

 

Minería de Datos: Procedimientos, tecnologías y algoritmos para poder extraer patrones interesantes (perfiles de buenos y malos clientes) de la información acumulada.

 

Moralidad: Serie de antecedentes sobre el grado de cumplimiento en compromisos crediticios de un sujeto. Incluye cumplimiento de compromisos con el banco, con otros bancos, con otras instituciones financieras, con casas comerciales, etc. Además incluye el grado de cumplimiento del cónyuge, socios, o personas jurídicas en la que tenga participación importante.

 

Monitoreo: Procedimientos y programas computacionales que mes a mes calculan la capacidad predictiva de los scoring crediticios y modelos de behavior. Normalmente los informes en papel y en pantalla se acompañan con gráficos mostrando la evolución de la predictibilidad en el tiempo.

 

Muestreo: Selección de una subpoblación de la cartera de clientes para utilizarla en la construcción de un scoring.

 

Redes Neuronales: Método no lineal de calcular el scoring. Se basa en un ajuste de parámetros que permiten luego hacer muy buenas predicciones. Todavía no es muy usado. El mayor problema es que es difícil interpretar los resultados por ser una fórmula muy críptica.

 

Scoring : Puntaje basado en una fórmula. La fórmula puede ser una suma ponderada de factores, o una combinación no lineal de factores, o un árbol de decisión, o reglas de decisión, o una combinación de todas las posibilidades anteriores. El rango de valores del scoring puede ser de 0 a 100, o de 0 a 1000, o según se convenga.

 

Testeo: Procedimientos informáticos y estadísticos para medir el grado de predictibilidad de un scoring.

 

Validación: Procedimientos para asegurar que un sistema realiza lo que se pretende que haga. En este caso que discrimine bien entre buenos y malos clientes, y que sea amigable, fácil de usar.

 

Verificación: Procedimientos para asegurar que un sistema realiza lo que se especificó por escrito. Un sistema puede tener su verificación ok pero no estar validado. O sea, puede hacer exactamente lo que se pidió, pero aún así no resuelve el problema de crédito. Esto sucede porque es muy difícil especificar por escrito todo lo que el sistema deba hacer y cómo lo deba hacer. Sin embargo, se debe intentar ser loa más claro y completo posible.