Problema social de diseño de sistemas

La ley de Goodhart
vista desde LessWrong

Cuando convertimos una métrica en objetivo, la gente aprende a optimizar la cifra… aunque eso destruya aquello que queríamos proteger. Para la comunidad de racionalidad, esta es una de las raíces silenciosas de muchos desastres sociales y políticos.

01 · Concepto

¿Qué es la ley de Goodhart?

En términos simples, la ley de Goodhart dice que cuando una medida se convierte en objetivo, deja de ser una buena medida. Mientras nadie esté intentando “jugar” la cifra, el indicador se parece bastante al fenómeno real que queríamos seguir. Pero en cuanto se liga a premios, castigos o prestigio, la métrica empieza a deformarse.

“Si juegas con el sistema bastante tiempo, acabas aprendiendo qué números tienes que mover, no qué realidades tienes que mejorar.”

LessWrong lo trata como un problema estructural: da igual que la gente sea “buena” o “mala”, si el sistema solo mira una cifra, las personas acabarán buscando atajos racionales para subir esa cifra, incluso a costa del objetivo original.

Notas escolares que sustituyen aprender Listas de espera maquilladas en sanidad Estadísticas policiales “gestionadas” Política convertida en encuestas y titulares
02 · De fallo técnico a problema social

Cuando optimizar métricas rompe la sociedad

Para la comunidad de racionalidad, la ley de Goodhart no es solo un chiste sobre estadísticas, sino una mecánica central del deterioro institucional. Cuando gobiernos, empresas o universidades se obsesionan con ciertos números, las personas que viven dentro del sistema tienen dos opciones: trabajar de verdad por el objetivo, o encontrar formas creativas de inflar la métrica.

Educación

“Aprobar” vs aprender

Si el sistema solo premia tasas de aprobado, se bajan niveles, se inflan notas o se presiona al profesorado. La cifra mejora, pero el conocimiento real puede hundirse.
Sanidad y servicios

Listas de espera “gestionadas”

Si el objetivo político es “reducir la lista oficial”, se cambian definiciones, se sacan casos de la lista o se derivan problemas. La estadística baja, pero la experiencia real de los pacientes no.
Política y opinión pública

Gobernar por encuestas

Si lo único que importa es el índice de popularidad, las decisiones se toman para mejorar el dato inmediato, no para sostener estructuras justas a largo plazo.
Idea central (LessWrong): no basta con pedir “buenas intenciones”. Si un sistema premia solo ciertas métricas, incluso gente bien intencionada acabará empujada a juegos y trampas.
03 · Estrategias

Cómo defenderse del efecto Goodhart

Ninguna solución es perfecta, pero desde LessWrong se insiste en diseñar sistemas que dificulten el juego de la métrica y mantengan vivo el contacto con la realidad.

Diseño de sistemas

Usar varias métricas a la vez

En lugar de una sola cifra mágica, se combinan varios indicadores que capturan dimensiones distintas del objetivo (cantidad, calidad, equidad, sostenibilidad…).

Es mucho más difícil encontrar un atajo que haga subir todas las métricas a la vez sin traicionar el espíritu del sistema.
Actualización de modelos

Revisar y ajustar métricas (enfoque bayesiano)

Las métricas no son sagradas: son hipótesis de trabajo sobre qué refleja bien el objetivo. Cuando se detecta que la gente las está jugando, hay que actualizar el modelo, igual que se actualizan creencias en inferencia bayesiana:
Observar: ¿la métrica sigue correlacionando con el resultado real?
Detectar desvíos sistemáticos y nuevas formas de juego.
Ajustar pesos, redefinir indicadores, o retirar los que se han vaciado de contenido.
No se trata de cambiar números al azar, sino de actualizar constantemente el modelo del mundo que esas métricas pretendían representar.
Recuperar contexto

Combinar datos cuantitativos y evaluación cualitativa

Las métricas numéricas se complementan con evaluación por pares, testimonios, observación cualitativa y revisión de casos concretos. Esto permite:
  • Detectar escenarios donde la cifra “buena” es claramente injusta.
  • Escuchar voces que los indicadores no capturan.
  • Triangular la verdad con miradas diferentes, no solo con un Excel.
Control y confianza

Auditorías aleatorias y transparencia de datos

Introducir auditorías aleatorias y publicar datos de forma transparente reduce la tentación de manipular cifras. Si quien intenta jugar la métrica sabe que:
  • Puede ser revisado de forma impredecible.
  • Sus datos se compararán con los de otros actores.
entonces la estrategia de “maquillar números” deja de ser tan rentable.
Horizonte temporal

Premiar resultados sostenibles a largo plazo

Cuando todo el sistema está centrado en el rendimiento inmediato, la ley de Goodhart se dispara: basta inflar los números de esta semana y ya. En cambio, premiar:
  • Estabilidad y mejoras acumuladas.
  • Impactos que no se pueden falsificar en un trimestre.
obliga a alinear métricas con trayectorias reales de cambio.
Diseño avanzado

Métricas invisibles para quien es juzgado

Otra estrategia es que no todas las señales usadas para evaluar sean públicas o fáciles de anticipar. El sistema puede:
  • Usar indicadores internos difíciles de manipular.
  • Combinar métricas visibles con otras que no se anuncian en detalle.
Eso hace más complicado diseñar trampas a medida, aunque también reduce la sensación de control del evaluado.
04 · Recordatorio final

Diseñar sistemas que sean difíciles de engañar

La perspectiva de LessWrong no es “las métricas son malas”, sino “las métricas sin teoría y sin vigilancia nos acaban devorando”.

Buena práctica social: cada vez que un número se convierte en objetivo (noten, ingresos, citas, encuestas, tiempos de espera), preguntar explícitamente: “¿Qué comportamientos estoy incentivando sin querer?” y “¿qué tendría que cambiar si la gente empezara a jugar con esta cifra?”.

Las sociedades que se toman en serio este problema no eliminan Goodhart por completo, pero sí consiguen que el juego de la métrica sea más costoso, visible y corregible.