Frecuentista o Bayesiano

3
¿FRECUENTISTA O BAYESIANO? En nuestra última entrada hablábamos un poco de qué nos ofrece la estadística. Lo que omitimos fue el cómo obtiene esos resultados. Existen muchos tipos de métodos, cada uno apto para un tipo de problema y con una serie de desventajas e inconvenientes a ponderar antes de utilizarlo. Pero, incluso antes de elegir la herramienta particular a usar, nos encontramos con que hay dos escuelas estadísticas diferentes. Aunque nosotros creemos que en la práctica ambas son igualmente útiles, hay (y más que hubo) científicos y analistas de datos que niegan validez de alguna de ellas. Por un lado tenemos a los frecuentistas que deciden proceder repitiendo el experimento muchas veces y contar las veces en las se da uno u otro suceso, esto es, miden las frecuencias relativas. Si un experimento no puede repetirse no tiene sentido hablar de la probabilidad de que suceda, ¿no? Y si aun así pudiésemos definirla ¿por qué querríamos hacerlo si el acontecimiento sucederá o no pero no se repetirá? Los bayesianos en cambio deciden utilizar su experiencia previa para condicionar el resultado del análisis. A fin de cuentas yo sé que ciertos resultados son menos probables o incluso imposibles incluso antes de realizar el primer ensayo. ¿Por qué no utilizar esa información? A priori tenemos cierta intuición, basada o no en datos, que nos permite definir la probabilidad de que se dé uno u otro resultado en el experimento a realizar. A esta distribución de probabilidad la denominaremos prior. Aunque no la hemos enfatizado ya ha aparecido la primera diferencia entre ambos enfoques: la definición de probabilidad. Los frecuentístas necesitan al menos unos cuantos ensayos para poder decir cómo de seguros se encuentran de que suceda algo en particular mientras que los bayesianos apostarán por un resultado antes de empezar a experimentar. De hecho, si el suceso es único los bayesianos pueden dar un valor de probabilidad. El truco está en que la palabra probabilidad tiene significados diferentes y mientras para los frecuentistas hablan de frecuencias relativas los bayesianos se refieren a la certidumbre que tienen de que suceda el fenómeno. De esta forma un bayesiano puede afirmar que mañana hay una probabilidad del 80% de que llueva aunque el día de mañana sea irrepetible.

description

A priori Bayes vs. Frecuentistas

Transcript of Frecuentista o Bayesiano

¿FRECUENTISTA O BAYESIANO?

En nuestra última entrada hablábamos un poco de qué nos ofrece la estadística. Lo que omitimos fue el cómo obtiene esos resultados. Existen muchos tipos de métodos, cada uno apto para un tipo de problema y con una serie de desventajas e inconvenientes a ponderar antes de utilizarlo. Pero, incluso antes de elegir la herramienta particular a usar, nos encontramos con que hay dos escuelas estadísticas diferentes. Aunque nosotros creemos que en la práctica ambas son igualmente útiles, hay (y más que hubo) científicos y analistas de datos que niegan validez de alguna de ellas.

Por un lado tenemos a los frecuentistas que deciden proceder repitiendo el experimento muchas veces y contar las veces en las se da uno u otro suceso, esto es, miden las frecuencias relativas. Si un experimento no puede repetirse no tiene sentido hablar de la probabilidad de que suceda, ¿no? Y si aun así pudiésemos definirla ¿por qué querríamos hacerlo si el acontecimiento sucederá o no pero no se repetirá?

Los bayesianos en cambio deciden utilizar su experiencia previa para condicionar el resultado del análisis. A fin de cuentas yo sé que ciertos resultados son menos probables o incluso imposibles incluso antes de realizar el primer ensayo. ¿Por qué no utilizar esa información? A priori tenemos cierta intuición, basada o no en datos, que nos permite definir la probabilidad de que se dé uno u otro resultado en el experimento a realizar. A esta distribución de probabilidad la denominaremos prior.

Aunque no la hemos enfatizado ya ha aparecido la primera diferencia entre ambos enfoques: la definición de probabilidad. Los frecuentístas necesitan al menos unos cuantos ensayos para poder decir cómo de seguros se encuentran de que suceda algo en particular mientras que los bayesianos apostarán por un resultado antes de empezar a experimentar. De hecho, si el suceso es único los bayesianos pueden dar un valor de probabilidad. El truco está en que la palabra probabilidad tiene significados diferentes y mientras para los frecuentistas hablan de frecuencias relativas los bayesianos se refieren a la certidumbre que tienen de que suceda el fenómeno. De esta forma un bayesiano puede afirmar que mañana hay una probabilidad del 80% de que llueva aunque el día de mañana sea irrepetible.

Por otro lado parece que el enfoque frecuentista es más objetivo (de hecho en muchas ocasiones se denomina objetivistas a los frecuentistas) mientras que los bayesianos contaminan el estudio con sus sesgos y prejuicios. Esto es completamente cierto y sucede porque el mismo hecho de definir un prior implica asumir hechos sobre los que no necesariamente tenemos datos. Sin embargo, lo cierto es que este inconveniente se difumina si se tiene en cuenta que los procesos de tratamiento estadístico usan los datos para corregir o actualizar ese conocimiento previo. Al final, si se dispone de suficientes datos, el resultado de los dos métodos será similar.

La última diferencia que queremos remarcar, no la última que queda por explicar, tiene que ver con cómo se aborda el proceso de inferencia según una y otra forma de entender la estadística. En ambos casos se usa unos datos (población muestral) para verificar la verdad o falsedad de una afirmación (hipótesis); por ejemplo, queremos usar una muestra de la población total para inferir algo que suponemos sucede en la población total.

El enfoque frecuentista considera que los datos son aleatorios debido a la naturaleza del proceso que los genera y que cada vez que repitamos el experimento obtendremos un resultado diferente. De la misma forma cree que la hipótesis será cierta o falsa para el proceso

estudiado pero que debido a la naturaleza aleatoria de los datos nuestro análisis puede señalarla como falsa cuando es cierta (falso negativo) o verdadera cuando es falsa (falso positivo). Por ello el enfoque frecuentista nos proporcionará, además de una respuesta a la pregunta de si la hipótesis es cierta o falsa, una probabilidad denominada p-valor. Este número es un indicador cuantas veces tendríamos que repetir la toma de datos y el análisis estadístico para obtener el resultado opuesto. Nótese que, al ser los datos aleatorios, siempre puede ser que acabe usando un conjunto que me apunte en la dirección contraria a la que realmente se comporta la población total.

Los bayesianos le dan la vuelta al enfoque frecuentista. Para ellos los datos son fijos, no aleatorios porque ¿no se han obtenido ya? ¿Qué tienen de aleatorios los valores anotados en esas tablas que hemos ido generando? En cambio la hipótesis es para ellos aleatoria y puede ser o no verdad. Los bayesianos no determinan si la hipótesis es cierta o falsa, únicamente calculan la probabilidad (en sentido bayesiano) de que sea cierta o falsa.

Esto es, ante la pregunta de si una hipótesis es correcta, los frecuentistas responden un sí o un no pero apostillan con qué frecuencia obtendrías el resultado opuesto mientras que los bayesianos no responden directamente y se limitan a indicar cómo de seguros están de uno u otro resultado.

¿Por qué indicábamos antes que un tipo de enfoque es el inverso del otro? Visto desde un punto de vista más matemático, los frecuentistas se preguntan por la probabilidad de que se obtengan los datos que se han recogido en la práctica bajo el supuesto de que la hipótesis es cierta. Los bayesianos, por el contrario, se preguntan por la probabilidad de que la hipótesis sea cierta sabiendo que hemos recogido unos datos en particular.