Los “pronósticos” electorales de las encuestas están en cuestión. El supuesto fracaso en estimar la distancia real entre Rodríguez Larreta y Lousteau hace dos domingos desató una ola de críticas a la profesión. ¿Son justas?
No me refiero aquí a cuestiones de ética. No es novedad que en nuestro país algunos encuestadores alteran los números que difunden a pedido de sus clientes (entre ellos el gobierno nacional, un pionero en esta práctica). Hay, sin embargo, consultores que por motivos de honestidad personal y reputación profesional, ejecutan y difunden sus encuestas correctamente. ¿Han realmente fracasado? ¿Por qué no “aciertan”?
Las encuestas publicadas antes del ballottage porteño básicamente coincidían –luego de proyectar indecisos– en atribuir aproximadamente un 55% de los votos a Larreta (y un 45% a Lousteau). La realidad fue 51,6% para el PRO (y 48,4% para ECO), una distancia de 3,4% entre el pronóstico y las urnas. ¿Es mucho?
Veamos, el “error muestral” típico es de ±3,5%. Esto significa que, con muy alta seguridad (el ubicuo “95% de confianza”), la cifra real (“el parámetro”) está a una distancia de 3,5% o menos de la estimación muestral. Si la encuesta arrojó el 55% para Larreta, su intención de voto real estará entre el 51,5% y el 58,5%. Varios encuestadores argumentaron, correctamente, que los resultados estuvieron dentro del margen de error.
Ahora bien, el error muestral es aleatorio o asistemático (a veces por encima y a veces por debajo del valor real), pero las encuestas coincidieron en sobreestimar al PRO. Esto sugiere que además del inevitable error aleatorio hubo error sistemático (o sesgo, un defecto “siempre para el mismo lado”). Esto puede ocurrir cuando se viola el crítico principio de igual probabilidad de selección para cada votante. Así, si por algún motivo los simpatizantes del PRO fueran especialmente propensos a estar en sus casas cuando llega o llama el encuestador (o a aceptar contestar encuestas), habría sesgo muestral en favor de Larreta.
Hay también sesgos “no muestrales”, que se originan en el inevitable error de medición, es decir, en la diferencia entre lo que se busca capturar (el voto del encuestado el día de la elección) y lo que realmente se captura (la intención que reporta algunos días antes de la elección). Si esta diferencia es también siempre “para el mismo lado”, tenemos “sesgo de medición”. Puede ocurrir, por ejemplo, si cierto tipo de votantes tiende a responder insinceramente o incluso equivocadamente (imaginemos que algunos dicen votar a Larreta, pero luego deciden irse de vacaciones el fin de semana electoral). Podría haber también quien cambie de opinión entre el día de la entrevista y el de la elección. Las encuestas publicadas, sujetas a la veda electoral, no llegan a captar estos cambios.
Estos problemas son universales. En las recientes elecciones en el Reino Unido todas las encuestas publicadas subestimaron al conservadurismo. El error promedio fue de aproximadamente -4%. Algo de sesgo y algo de cambio de último momento parecen explicar la diferencia.
Finalmente está la insoluble cuestión de los indecisos. Se los puede asignar vía varios métodos a los diferentes candidatos, pero en todos los casos se trata de una proyección basada en supuestos y no de un dato real.
Habiendo error muestral, sesgo muestral, error de medición e indecisos, es de alguna forma un milagro que muestras relativamente pequeñas nos permitan conocer el comportamiento de millones de votantes con bastante precisión. Consultores y periodistas deberían comunicar con claridad que las encuestas que difunden no son más que una estimación aproximada. A veces sondeos y urnas diferirán por el 3% o 4%, a veces incluso por el 6% o 7%, pero casi nunca por más que eso. Suficiente como para tener un panorama de la situación de cada candidato; insuficiente para pronosticar con certeza el ganador de una elección reñida.
*Profesor en el Departamento de Ciencia Política y Estudios Internacionales de la Universidad Torcuato Di Tella.