Introducción
a la Minería de Datos para construir Sistemas de Análisis de Riesgo Crediticio
de Consumo.
Introducción
Productividad
Calidad
Oportunidades: Tecnología y Metodologías
Principales Desafíos en la Implementación de Tecnologías Crediticias
Conocimientos y Capacitación
Calidad
de la Información
Construcción
de los scoring
Introducción
El crédito de consumo ha
experimentado en toda Latinoamérica un
fuerte crecimiento en los últimos años. Bancos, financieras, administradoras de
tarjeta y tiendas de departamento colocan un volumen creciente de recursos en
créditos de consumo. Estos representan una parte significativa y muchas veces
central del negocio de bancos e instituciones financieras.
El carácter masivo y la
rapidez de las decisiones son las características claves que definen las
estrategias y tácticas del negocio. Por consiguiente, el manejo eficiente de un
gran volumen de información para la evaluación rápida y precisa del riesgo,
determina la rentabilidad y supervivencia de las instituciones.
Desde un tiempo a esta
parte, el proceso de crédito ha experimentado un gran incremento en agilidad.
La fuerte competencia ha conducido a una mayor eficiencia del servicio.
Lamentablemente, en muchas ocasiones esto ha significado un aumento
considerable en la mora, obligando a la desaparición de algunos actores.
Sin embargo, nuevas
metodologías y tecnologías de evaluación y gestión del riesgo crediticio
permiten obtener la productividad requerida sin deteriorar la calidad de la
cartera. En definitiva, los dos factores claves de la banca de consumo son productividad
y calidad de las evaluaciones y decisiones.
Productividad
Existen diferentes
mediciones de productividad. Una de las principales es el número de
colocaciones por empleado o por ejecutivo. Es importante que las instituciones
conozcan este indicador y hagan benchmarking con otras instituciones del país y
extranjeras. La comparación permite conocer potenciales futuras amenazas y
planificar estrategias de desarrollo del sector.
Calidad
Básicamente, la calidad está determinada por la mora. Es muy importante
que el monitoreo no sólo sea global, sino por producto y por sector de
actividad económica. Un seguimiento segmentado permite ayudar a corregir a
tiempo potenciales dificultades.
Oportunidades: Tecnología y
Metodologías
Las diferentes alternativas metodológicas y tecnológicas de evaluación
y seguimiento del riesgo crediticio pueden clasificarse en cuatro grupos:
Alternativa tradicional. La metodología
tradicionalmente utilizada en las instituciones financieras consiste en que los
ejecutivos de cuenta evalúan solicitudes de crédito utilizando su propia
experiencia y basándose implícitamente en guías, circulares y manuales
publicados y divulgados por la gerencia de riesgo o alguna gerencia
equivalente. Paralelamente, se realizan con cierta frecuencia cursos y seminarios
de riesgo crediticio para asegurar una cierta homogeneidad y calidad de las
decisiones.
Este método tiene las
siguientes dificultades:
Pobre
desempeño: la experiencia de la mayoría de los ejecutivos de cuenta es limitada,
lo cual significa producir decisiones heterogéneas, y muchas de ellas con un
gran grado de imprecisión.
Inflexibilidad: se requiere
experiencia de varios años antes que los ejecutivos se desempeñen bien. Por
esta razón, este método reacciona lento a los cambios en la población de
solicitantes de créditos.
Inconsistencia: Diferentes
ejecutivos poseen estándares diferentes.
Baja
eficiencia: Evaluar solicitudes consume tiempo e involucra también a personal
experimentado de jerarquía superior.
·
Imposibilidad
de monitoreo efectivo: La gran heterogeneidad de las decisiones
realizadas y la imposibilidad de conocer los criterios efectivamente
utilizados, hace imposible efectuar un proceso de moniteoreo y
retroalimentación constante para mejorar futuras decisiones crediticias.
Esta alternativa es la que
tradicionalmente se ha utilizado en la banca de personas. Típicamente a
personas de nivel medio alto, de bajo riesgo, y en donde los altos márgenes
permiten operar en forma rentable aún cuando el servicio es muy personalizado y
con muy baja productividad. Esta alternativa no es rentable en la banca de
consumo. Por otra parte, el crecimiento de la competividad ha obligado hoy en
día a que incluso la banca de personas se tecnologice y automatice para
aumentar significativamente la productividad.
Segunda alternativa: matrices y
tablas. Las limitaciones de la alternativa tradicional unidas a una creciente
competividad ha obligado a las instituciones a buscar alternativas más
eficientes. La más común es el diseño y uso de matrices, tablas o métodos de
puntajes. Típicamente estos se desarrollan en base a la experiencia de
ejecutivos con años de actividad en el sector y basándose en plantillas y/o
modelos de otras instituciones del país o del extranjero. Ocasionalmente
también se realizan estudios estadísticos sobre capacidad de pago de algunos
segmentos de la población, lo cual orienta a los diseñadores a realizar ajustes
a algunos criterios incluidos en las matrices.
Si bien esta alternativa ya
es un progreso respecto a la anterior, todavía puede mejorarse enormemente. Sin
embargo, su aplicación requiere un seguimiento bien controlado pues en
ocasiones puede llevar a deteriorar la calidad de las decisiones
crediticias. Las principales
debilidades son:
Potencial
peligro de pobre desempeño: es necesario controlar y cuantificar el efectivo
cumplimiento de los criterios de las matrices y la potencial manipulación
(maquillaje) de datos para conseguir puntajes aceptables. Se recomienda
cuantificar periódicamente el porcentaje de exepciones y realizar muestras
periódicas para determinar por cada ejecutivo la calidad de la información que
él ha utilizado.
Mediana
flexibilidad: nuevos criterios significa un proceso de lenta asimilación que
requiere un largo tiempo hasta que los ejecutivos los apliquen adecuadamente.
Por lo tanto, este método reacciona lento a los cambios en la población de
solicitantes de créditos.
Escasa
retroalimentación: al carecer de un sistema automático de seguimiento
de la efectividad de las políticas diseñadas, es muy difícil establecer un
esquema de rediseño permanente y basado en criterios sólidos. Los cambios que
típicamente se proponen, se basan en experiencias personales sin una validación
sistemática.
Una tercera alternativa
es automatizar el proceso de crédito, convirtiendo la matriz o tabla de
puntajes a un programa computacional. Típicamente esto se hace mediante alguna
macro en Excel o algún otro software. Así, con la ayuda del computador es
posible llegar a la toma de decisión instantánea, en el mismo momento cuando el
cliente solicita el crédito. El computador accede a la información de
moralidad, información demográfica, información sectorial, información sobre
endeudamiento del cliente e información sobre la operación, y el sistema ayuda
al ejecutivo a discriminar si el cliente es sujeto de crédito. De esta manera
la uniformidad de criterios y la rapidez del servicio quedan completamente
garantizados.
Sin embargo, las principales
limitaciones son:
Desconocimiento
de precisión: la sola conversión de una tabla de decisiones a un mecanismo
computacional no garantiza la precisión del instrumento. Aún más, al ser éste
un mecanismo automático y críptico puede perpetuar malos criterios y en
ocasiones aumentar la mora. Es necesario implementar metodologías que
permanentemente evalúen la precisión de las evaluaciones.
Desajustes
por cambio macroeconómicos o sectoriales: aún cuando el sistema se
haya inicialmente diseñado considerando criterios validados basados en
información acumulada es necesario establecer procedimientos de seguimiento y
ajustes permanentes.
Cuarta alternativa: construcción y
ajuste permanente de sistema de evaluación de riesgo crediticio (credit
scoring) basado en tecnologías de minería de datos. Esto significa construir y
mantener un sistema de información orientado a facilitar la búsqueda de
perfiles de clientes riesgosos y un software de análisis del comportamiento de
pagos de la cartera de clientes especializado en detectar y caracterizar
clientes de alto riesgo. Las tecnologías típicamente utilizadas son: análisis
discriminante, inducción de árboles de decisión y redes neuronales. Todas ellas
dan lugar a credit scoring basados en minería de datos.
Es importante señalar que es
difícil establecer rápidamente la diferencia entre esta alternativa y la
tercera alternativa. Los credit scoring construidos se ven iguales en
apariencia. Sin embargo, las tecnologías subyacentes son radicalmente
diferentes y las diferencias en desempeño son enormes. Esta confusión está muy
difundida. Todavía muchos banqueros no comprenden la diferencia y creen tener
un credit scoring de última tecnología cuando todo lo que han implementado es
una matriz computacional.
Dada la sofisticación de los
métodos estadísticos de análisis de riesgos requeridos para la construcción
satisfactoria de estos sistemas, éstos son típicamente construidos por
proveedores externos altamente especializados.
La principal dificultad de
los credit scoring construidos en base a minería de datos, es la necesidad de
contar con personal capacitado en las tecnologías de minería de datos aplicada
a análisis de riesgo que pueda verificar periódicamente la validez de estos
sistemas: tantos aquellos en uso como los con nuevas modificaciones.
Principales Desafíos en la
Implementación de Tecnologías Crediticias
Presentamos
aquí los principales desafíos que experimentan las instituciones al introducir
tecnologías de evaluación de riesgo crediticio para créditos de consumo. Las
posibilidades de cometer errores son muchas y muy variadas. El plazo típico
para introducir estas tecnologías es de un año a dos, pero la asimilación
completa puede tomar hasta cuatro años.
A continuación se describen estos desafíos, todo lo cual respalda los
cuestionarios de campo sugeridos para las visitas de inspección.
Conocimientos
y Capacitación
·
Conocimientos
de Modelos Estadísticos. Hay tres problemas básicos en el conocimiento de modelos estadísticos.
·
Por
una parte la formación estadística básica del personal no es óptima. La
estadística es una especialización que todavía no está muy difundida, por lo
que el personal profesional de las instituciones a lo más tuvo uno o dos cursos
de estadística en los estudios universitarios para obtener su título
profesional.
·
Por
otra parte, los conocimientos adquiridos en la Universidad están ya olvidados.
Lo pocos conocimientos adquiridos no son constantemente utilizados, por lo que
muy probablemente están ya olvidados.
·
Finalmente,
los conocimientos estadísticos del personal no se ajustan a las necesidades
para la construcción de modelos de scoring crediticio. No es que estén
obsoletos, si no que lamentablemente en las universidades latinoamericanas los
conocimientos de los profesores son más bien teóricos, sin ninguna experiencia
en problemas de modelos estadísticos para créditos. Esto significa que a los
estudiantes no se les enseña los contenidos necesarios para luego poder
construir credit scorings.
·
Conocimientos
de Parámetros Principales. Existe una serie de dificultades para seleccionar los parámetros que
inicialmente serán analizados y considerados en un modelo. Es necesario tener
conocimientos sobre los siguientes parámetros y alguna experiencia sobre sus
rangos típicos y dificultades de recolección:
·
Parámetros
demográficos. Los típicos son sexo, profesión, educación, edad, cargas,
antigüedad en el empleo, ingresos, etc. Es muy importante diferenciar los
parámetros del individuo de los del grupo familiar, así como múltiples
posibilidades de errores o malas clasificaciones.
·
Parámetros
de moralidad crediticia. Estos corresponden a información sobre comportamiento
crediticio del cliente. Puede dividirse en dos: dentro de la misma institución
o con otras instituciones (financieras u otras). La calidad de la información
es crítica, y aquí radica la mayor dificultad. En general, los credit bureaus
son nuevos en Latinoamérica por lo que la información es muchas veces
inconsistente o contiene errores graves. Finalmente, un malentendido muy
difundido es el relacionado con el instante a que se refiere esta información.
Según se vaya a construir un credit scoring de iniciación o uno de
comportamiento (un behavior), la información se refiere a distintos momentos.
·
Parámetros
sectoriales. Corresponde al sector económico al que pertenece el cliente.
Lamentablemente la clasificación no siempre existe y cuando existe no es
siempre consistente. Diferentes empleados y pertenecientes a diferentes niveles
son los que han clasificado los
clientes. Adicionalmente, los criterios utilizados no son uniformes y no están
claramente documentados.
·
Parámetros
de comportamiento. Son los parámetros utilizados en sistemas de comportamiento
(behaviors). Típicamente corresponden a una ventana móvil con datos como días
de mora en los últimos 12 meses previos al mes seleccionado, (o los últimos 6
meses, o 3 meses), saldo actual sobre
el saldo máximo en los últimos 12 meses, etc. Estos parámetros no son
utilizados en sistemas de iniciación, pero en los de comportamiento son los
críticos. Las dificultades se deben a vacíos y errores en los que la mora de un
cliente puede de un mes a otro saltar más de 30 días. Falta de experiencia en
estos potenciales errores pueden hacer que se construya un bahavior sobre
información errónea.
·
Parámetros
de seguimiento y de clasificación entre buenos versus malos clientes. Las bases
de datos que mantiene el Departamento o Gerencia de Sistemas con los pagos de
los clientes no han sido diseñadas para hacerles minería de datos. Por esta
razón hay muchos vacíos, información superflua, y no cruza con la información
disponible en carpetas. Falta de conocimiento y experiencia en estas
definiciones pueden demorar un proyecto en varios meses.
·
Conocimientos
de muestreo. La
teoría del muestreo es una materia compleja dentro de la estadística. Adicionalmente,
no se enseña en las universidades y, lamentablemente, cuando se llega a enseñar
en la Universidad no se le dedica más que un par de clases. Otra dificultad
adicional es que existen en el muestreo una serie de dificultades prácticas que
no entran como parte de los contenidos típicamente enseñados.
·
Definición
de la muestra. No es simple determinar el tamaño de la muestra, ni la
definición de buen versus mal cliente. Típicamente debe además construirse una
muestra para testeo, cosa que muy raramente se hace. Inexperiencia en estos
temas puede hacer que los scoring construidos sean definitivamente malos, o en
el mejor de los casos, que un tercero se dé cuenta de los problemas y sea
necesario comenzar de nuevo con el proyecto de construcción de un scoring.
·
Reescalamiento.
Esto es materia de gran confusión, pues resultados obtenidos de las muestras
deben ser reescalados para su interpretación final. Esto se debe a que en la
muestra se trabajan con una proporción de muchos más malos clientes que en la
población general. Inexperiencia en este tema es causa de que los análisis sean
mal interpretados y se construyan scoring completamente errados.
·
Procedimientos
de muestreo. Es importante conocer los diferentes algoritmos de muestreo, así
como los algoritmos que pueden llenar vacíos cuando la información que falta es
reducida.
·
Verificación
de la muestra. Es muy importante ejecutar procedimientos y cálculos para
asegurarse que la muestra es representativa. Por ejemplo, graficar buenos y
malos por zona geográfica, edad, monto del crédito, etc.
·
Necesidades
de recolectar información. En muchos casos es necesario recolectar información
adicional que no está en carpetas o en forma digital. Es importante prever esta
posibilidad y conocer cuándo es necesario recolectar información adicional así
como los cuidados que se deben tener y los plazos típicos que esta acción
adicional implica.
·
Muestras
digitales versus muestras de carpetas. Es necesario saber determinar cuándo se
puede utilizar información digital y cuándo es inevitable recolectar carpetas
físicas. También es importante conocer las dificultades típicas para recolectar
información de carpetas. Esto incluye: personal adecuado, construcción de un
programa ingresador, administración de la digitación, verificación de la
calidad de la información digitada, planes y acciones en caso de carpetas
perdidas.
·
Interpretación
de resultados. Estos conocimientos son los más difíciles de adquirir y dominar.
Se requiere una conjunción de habilidades y conocimientos matemáticos y
estadísticos junto con experiencia y conocimientos en créditos de consumo. Es
importante destacar que no basta con tener personal que conozcan por una lado
un aspecto y otros que dominen el otro. Es necesario alguien que maneje bien
ambos aspectos: el estadístico y el crediticio.
·
Conocimientos
de Testeo. Aquí hay
una serie de procedimientos y algoritmos que es muy común que los principiantes
e inexpertos no sólo no los hagan adecuadamente si no que en muchos casos ni
siquiera los consideren. Aún cuando la institución financiera externalice todo
el proceso de construcción de un scoring o un behavior, y lo haga con terceros
muy experimentados, no puede dejar de hacer tests independientes que le
aseguren la calidad del modelo y que este será mejor que con los métodos y
prácticas que ha venido utilizando hasta ahora. Los principales conocimientos
de testeo son:
·
Muestreo
para el testeo. Este muestreo es diferente del muestreo para la construcción
del scoring y es muy común que los principiantes e inexpertos no lo hagan (y ni
siquiera lo planifiquen).
·
Seguridad
y confidencialidad. Es esencial que los constructores del scoring no tengan
acceso a la información de testeo y deba entonces existir procedimientos
seguros para evitar el escurrimiento de información.
·
Técnicas
de comparación. Toda prueba con una muestra independiente no tiene la misma
predictibilidad que con los datos con que se construyó el scoring. Es
importante saber comparar resultados y conocer métodos de medición y
comparación entre diferentes modelos.
·
Conocimientos
de Implementación.
Aún cuando se haya desarrollado un scoring estadísticamente sólido y con un
buen poder predictivo, muchos proyectos fallan en la parte de implementación
final. Aquí se lista una serie de conocimientos necesarios para minimizar este
riesgo.
·
Integración
de la información. En la implementación final hay que conocer las diferentes
fuentes de información que se deben integrar en tiempo real. Esto involucra
varios desafíos por formatos, protocolos, tiempos de respuesta, etc. Cada uno
de estos temas involucra diferentes personas y significan tiempos y retrasos
que a veces son muy significativos (llegando incluso a ser varios años).
·
Problemas
de comunicación. Es necesario prever dificultades de comunicación con las
oficinas, sobre todo con aquellas en zonas remotas y conocer los inconvenientes
técnicos que ello involucra. En caso de problemas cuya solución signifique
plazos muy largos hay que prever planes de introducción paulatina y
procedimientos para manejar el proceso crediticio en una etapa de transición
donde algunas oficinas estarán completamente automatizadas y otras con
procedimientos antiguos.
·
Integración
de software en diversas plataformas. Diversas bases de datos están normalmente
en computadores diferentes y en lenguajes de programación distintos.
·
Puestas
en marcha. Es importante prever y planificar cuidadosamente marchas pilotos y
medir su impacto tanto técnico (informático y crediticio) como organizacional
(roles, nuevos procedimientos, etc.).
·
Conocimientos
de cambios organizacionales. Aún después de una cuidadosa y exitosa implementación, varios scorings
y behaviors terminan sin usarse o con un porcentaje muy bajo de utilización.
Conocer estas dificultades y cómo administrarlas es muy importante. Las
principales son:
·
Nuevas
funciones y cargos. El uso de scoring involucra la creación de nuevos cargos.
Algunos de estos cargos son: capacitador de ejecutivos, soporte, responsable
del monitoreo del scoring, etc.
·
Redefiniciones
de responsabilidades. Es importante conocer las nuevas responsabilidades del
gerente de riesgo o crédito, y las nuevas necesidades de diálogo permanente con
sistemas y con la gerencia comercial.
·
Cambios
en organigrama. Muchas veces la implementación final de un scoring involucra
cambios de poder. Esto debe conocerse de antemano y quedar claramente
explicitado y debidamente planificado.
·
Reingeniería
del crédito. El proceso completo de introducir scoring y behaviors significa
una reingeniería del proceso de crédito. Nuevos performances deben lograrse,
nuevas interrelaciones aparecen y viejas prácticas se modifican y desaparecen.
Conocer cómo manejar la transición y cómo combatir las inercias es clave para
el éxito definitivo.
Calidad
de la Información
Aquí se
presentan muy rápidamente los principales problemas con la calidad de la
información. Estos problemas son muy típicos en la banca latinoamericana, pues
está recién comenzando a introducir las tecnologías de minería de datos. La
calidad actual es suficiente para las operaciones tradicionales de la banca,
pero insuficiente para las demandas de precisión que requieren los credit
scoring. En el período de transición que está experimentando la banca
actualmente es muy importante prestar atención a la calidad de la información y
desarrollar planes remediales para depurar la información.
·
Vacíos
en la información.
·
Inexistencia
de ciertos registros. En muchas bases de datos de clientes existen lagunas donde registros completos (carpetas
completas) han desaparecido. Esto dificulta el análisis cuando no se puede
determinar si estas inexistencias corresponden a buenos o malos clientes o si
está desproporcionadamente cargado para uno de los dos lados.
·
Campos
sin información. Adicionalmente a la inexistencia de registros completos pueden
existir campos (edad, ingreso, etc.) que estén casi vacíos. Si es así hay
varias posibilidades de acción, pero todas requieren esfuerzos no
despreciables, plazos adicionales y cuidadosas metodologías.
·
Formatos
·
Diversas
bases de datos están codificados en distinta forma, o en distintos sistemas de
administración de la información.
·
Otras
veces los campos están en forma de texto libre (por ejemplo, ciudad ). Todo
esto requiere un trabajo de preprocesamiento no despreciable que puede tomar
varios meses.
·
Campos
mal codificados. Diferentes codificaciones de fechas, información nula
reemplazadas por ceros u otros valores (por ejemplo, clientes con 0 años de
edad), etc.
·
Información
errada. Esto va desde información corrida que corresponde a otros campos, a
errores por interpretación del significado de nombre de variable o valores
escritos en forma muy resumida o críptica, hasta errores en el salto de valores
que lógicamente no son posibles (por ejemplo, un cliente pasa de un mes a otro
con un salto en los días de mora de más de 30 días). Es necesario realizar
diferentes procedimientos de chequeo. Algunas estrategias recomendadas son por
ejemplo:
·
Diversos
gráficos de fácil interpretación. En forma visual es muchas veces mucho más
fácil detectar errores.
·
Chequeos
de ordenes de magnitud
·
Comparación
entre diversos años y diferentes oficinas
·
Chequeos
de sumas totales y/o parciales.
·
Cruces
de información repartida en diversas bases de datos. Típicamente estas diversas
bases de datos tienen diferentes dueños y, por lo tanto, no conversan entre sí.
Esto se puede convertir en una gran pesadilla, que puede alargar un proyecto en
varios meses. Los principales problemas son:
·
Cruce
base de datos de iniciación con base de datos de moralidad. Esto se debe a que
la información de iniciación proviene principalmente de solicitudes pero la de
moralidad se accesa a proveedores externos y a la SuperIntendencia. Muchas
veces las claves para identificar un cliente no coinciden, y a pesar de que la
información está en ambos lados no es posible unirlas adecuadamente.
·
Cruce
base de datos de iniciación con comportamientos de pago. Este es un problema
mayor. La información de iniciación proviene principalmente de solicitudes pero
la de comportamiento de pagos la lleva sistemas y lo hace con objetivos
operacionales muy distintos. Muchas veces las claves para identificar un
cliente no coinciden, y a pesar de que la información está en ambos lados no es
posible unirlas adecuadamente.
Construcción
de los scoring
A
continuación se listan las principales dificultades en la construcción e
implementación de los scoring para evaluación crediticia.
·
Muestreos
para la construcción y el testeo. Las dificultades van desde el tamaño de la
muestra, la definición de buenos versus malos clientes, los algoritmos de
muestreo, qué hacer en caso de información pedida, algoritmos de llenado de
vacíos, decisiones de entrevistas y visitas a clientes, etc.
·
Testeo
y Validación. Este es el punto más importante y típicamente nunca realizado por
los inexpertos. Aún cuando el sistema sea construido por terceros,
especializados en credit scoring, es muy importante que la institución
financiera tenga una medida independiente y no interesada sobre la capacidad
predictiva de los scoring que está recibiendo. En nuestras visitas de
diagnóstico en instituciones financieras hemos podido confirmar la indiferencia
generalizada por los bancos latinoamericanos sobre este crítico aspecto. Las
inspecciones deberían apuntar a determinar si las medidas de testeo están
siendo llevadas a cabo, y si no es así a ayudar a las instituciones a asignar
los recursos necesarios para implementar los procedimientos de testeo. Es la
mejor manera de asegurar que la introducción de estas nuevas tecnologías no
produzca deterioros de la calidad de las carteras, comunes en la introducción
de estos métodos dada la inexperiencia de las instituciones.
·
Monitoreo.
Todo sistema se desajusta y, por lo tanto, requiere un monitoreo permanente.
Esto significa una inversión en recursos computacionales, sistemas y personal
dedicado. La mayoría de los bancos no consideran estos gastos y luego de
construido un scoring no están muy dispuestos a hacerlo. El cambio de
mentalidad puede tomar bastante tiempo, y entre tanto los peligros de deterioro
de la cartera son altos.
Anexo:
Diccionario de Principales Términos
Algoritmo: Procedimiento de cálculo, que típicamente
contiene varias etapas, fórmulas, decisiones u otras acciones.
Análisis Discriminante: Método estadístico para encontrar
un buen puntaje lineal (de suma ponderada de factores).
Arboles de Decisión: Método para calcular puntajes en
base a segmentación de la población (por ejemplo: los clientes con buenos
antecedentes en la Superintendencia, con más de 5 años en el empleo, con edad más
de 30 años y con no más de 3 cargas tienen un puntaje de 975. )
Behavior: Scoring para predecir el pago o atraso
eventual de un cliente en los próximos 2, 4 o 6 meses de pago.
Buen cliente y mal cliente: Juicio al que se llega en común
acuerdo entre la dirección del banco, la gerencia comercial y de riesgos, y que
define quién es un cliente rentable versus uno no rentable.
Comportamiento: Conducta de pago del cliente. Típicamente es
la lista de atrasos mes a mes desde que se le otorgó el crédito.
Cruce de Información: Cruce entre diversas bases de datos
con información de los clientes. Típicamente por una parte está la información
de iniciación (al momento de solicitar el crédito), y en otra parte (y otros
sistemas) está el comportamiento de pago mes a mes. El cruce siempre es difícil
y hay muchos casos de clientes en una base pero no en la otra.
Inducción de Arboles de Decisión: Método de construcción de árboles
de decisión basado en análisis estadístico.
Iniciación: Scoring para evaluar el riesgo crediticio de
un solicitante de crédito.
KS: medida muy utilizada para cuantificar qué tan
buen discriminante es un parámetro. Por ejemplo, si la antigüedad en el empleo
tiene un KS de 25 quiere decir que es buen discriminante. KS cercanos a cero
son de variables muy mal discriminantes. Los cercanos a 100 son muy buenos.
También se puede calcular el KS de un scoring para medir qué tan bueno es. En
la práctica el scoring de un modelo de iniciación no pasan de 40 y el de
behavior de 60. La definición exacta es la siguiente: porcentaje de malos
rechazados por el modelo menos porcentaje de buenos rechazados por el modelo.
Minería de Datos: Procedimientos, tecnologías y algoritmos para
poder extraer patrones interesantes (perfiles de buenos y malos clientes) de la
información acumulada.
Moralidad: Serie de antecedentes sobre el grado de
cumplimiento en compromisos crediticios de un sujeto. Incluye cumplimiento de
compromisos con el banco, con otros bancos, con otras instituciones
financieras, con casas comerciales, etc. Además incluye el grado de
cumplimiento del cónyuge, socios, o personas jurídicas en la que tenga
participación importante.
Monitoreo: Procedimientos y programas computacionales que
mes a mes calculan la capacidad predictiva de los scoring crediticios y modelos
de behavior. Normalmente los informes en papel y en pantalla se acompañan con
gráficos mostrando la evolución de la predictibilidad en el tiempo.
Muestreo: Selección de una subpoblación de la cartera de
clientes para utilizarla en la construcción de un scoring.
Redes Neuronales: Método no lineal de calcular el scoring. Se
basa en un ajuste de parámetros que permiten luego hacer muy buenas
predicciones. Todavía no es muy usado. El mayor problema es que es difícil
interpretar los resultados por ser una fórmula muy críptica.
Scoring : Puntaje basado en una fórmula. La fórmula
puede ser una suma ponderada de factores, o una combinación no lineal de
factores, o un árbol de decisión, o reglas de decisión, o una combinación de
todas las posibilidades anteriores. El rango de valores del scoring puede ser
de 0 a 100, o de 0 a 1000, o según se convenga.
Testeo: Procedimientos informáticos y estadísticos
para medir el grado de predictibilidad de un scoring.
Validación: Procedimientos para asegurar que un sistema
realiza lo que se pretende que haga. En este caso que discrimine bien entre
buenos y malos clientes, y que sea amigable, fácil de usar.
Verificación: Procedimientos para asegurar que un sistema
realiza lo que se especificó por escrito. Un sistema puede tener su
verificación ok pero no estar validado. O sea, puede hacer exactamente lo que
se pidió, pero aún así no resuelve el problema de crédito. Esto sucede porque
es muy difícil especificar por escrito todo lo que el sistema deba hacer y cómo
lo deba hacer. Sin embargo, se debe intentar ser loa más claro y completo
posible.