Solo sé que sé menos cada día

Cierto grupo, pionero en la explotación del valor de sus datos, desarrolló un modelo de predicción de riesgo de impagos, usando los datos de los últimos 3 años, y consiguió reducir la incidencia de imagados desde un 3% de sus ventas a menos de un 1% rápidamente, a la vez que abordaba una gran expansión. Dos años después, no solo no podía permitirse prescindir de su póliza de cobertura de crédito, sino que la incidencia había vuelto a subir y el sistema funcionaba cada vez peor. Nadie les había hablado del “model drift”.

¿Qué ha pasado? Pues que el contexto ha seguido evolucionando mientras su modelo se quedaba estancado. Probablemente, al rechazar operaciones por riesgo de impago, su base de clientes ha ido cambiando lentamente, además de ser ahora una mayor base de clientes por su expansión, con nuevas prácticas y patrones de comportamiento, de manera que los datos que ahora alimentamos al modelo no tienen nada que ver con los que se usaron en su entrenamiento original. Dicho matemáticamente: P(x|y)P(x|y’), o sea, la probabilidad de impago (x) dados los datos de antes (y) es distinta a la probabilidad de impago dados los datos de ahora (y’).

Este tipo particular de degradación se conoce también como “data drift”, y se previene entrenando periódicamente de nuevo el modelo con los nuevos datos, dando mayor peso a los datos más recientes que los antiguos, adaptándolo así al contexto actual sin perder del todo el conocimiento pasado. La última etapa de la metodología CRISP-ML, de hecho, es la supervisión y evaluación continua del modelo, reentrenándolo o incluso reparametrizándolo cuando pierda precisión.

Otras veces los modelos se degradan porque los cambios se producen en las variables a predecir, porque cambien las reglas del juego o cambien los criterios. Por ejemplo, si antes no considerábamos moroso a un cliente que pagase a 180 días, y ahora decidimos cumplir con la ley y acortar los plazos de pago a 60 días o menos, nuestro modelo ya no será válido y hay que reentrenarlo. Este tipo de degradación se conoce como “concept drift”.

Los modelos de aprendizaje automático no olvidan, pero sí ocurre que, como nos ocurre a los humanos, lo que saben puede ir perdiendo valor con el tiempo. Reentrenarse o morir.

Imagen: Robot Sócrates pintado por Dall-E

53 comentarios en “Solo sé que sé menos cada día”

  1. Pingback: cialis 20mg pills

  2. Pingback: how long does escitalopram stay in your system

  3. Pingback: zoloft weight loss stories

  4. Pingback: metronidazole diphenhydramine

  5. Pingback: cephalexin and food

  6. Pingback: does duloxetine cause insomnia

  7. Pingback: what are side effects of keflex

  8. Pingback: does lexapro cause insomnia

  9. Pingback: buy viagra from mexico

  10. Pingback: missed cymbalta dose

  11. Pingback: gabapentin spots

  12. Pingback: fluoxetine uses

  13. Pingback: how long does it take cephalexin to work

  14. Pingback: ciprofloxacin vs amoxicillin

  15. Pingback: what bacteria does bactrim cover

  16. Pingback: dosage of bactrim for sinus infection

  17. Pingback: amoxicillin 500mg capsules

  18. Pingback: neurontin narcotic

  19. Pingback: citalopram and alcohol death

  20. Pingback: depakote and weight gain

  21. Pingback: augmentin generic

  22. Pingback: ezetimibe-related myopathy a systematic review

  23. Pingback: cozaar beta blocker

  24. Pingback: flexeril dose

  25. Pingback: what is diclofenac

  26. Pingback: contrave kidney problems

  27. Pingback: ddavp po to iv conversion

  28. Pingback: diltiazem hydrochloride er

  29. Pingback: flomax to treat kidney stones

  30. Pingback: effexor xr reviews

  31. Pingback: which medication is given to clients who are diagnosed with angina but are allergic to aspirin?

  32. Pingback: amitriptyline 25 mg

  33. Pingback: aripiprazole 2 mg side effects

  34. Pingback: does allopurinol cause weight gain

  35. Pingback: bupropion and sertraline combination treatment dosage

  36. Pingback: baclofen high

  37. Pingback: celexa headache

  38. Pingback: abilify for sleep

  39. Pingback: 10 units of semaglutide for weight loss

  40. Pingback: repaglinide and hypoglycemia

  41. Pingback: does remeron make you sleepy

  42. Pingback: actos package

  43. Pingback: acarbose metabolism

  44. Pingback: how long does protonix take to work

  45. Pingback: robaxin street value

  46. Pingback: purpose of tamsulosin

  47. Pingback: synthroid 0.1mg

  48. Pingback: desvenlafaxine vs venlafaxine

  49. Pingback: is voltaren gel over counter

  50. Pingback: cost of ivermectin medicine

  51. Pingback: spironolactone joint pain reddit

  52. Pingback: sitagliptin other names

  53. Pingback: tizanidine show up on drug test

Los comentarios están cerrados.

Scroll al inicio