Te explicamos la Diferencia entre T-TEST y ANOVA con ejemplos y definiciones. Conoce todos los datos para distinguirlos fácilmente.
¿Cuál es la Diferencia entre T-TEST y ANOVA?
PRUEBA T frente a ANOVA
Recopilar y calcular datos estadísticos para obtener la media suele ser un proceso largo y tedioso. La prueba t y el análisis unidireccional de la varianza (ANOVA) son las dos pruebas más utilizadas con este fin.
La prueba t es una prueba estadística de hipótesis en la que el estadístico de prueba sigue una distribución t de Student si se confirma la hipótesis nula. Esta prueba se aplica cuando la estadística de la prueba sigue una distribución normal y se conoce el valor de un término de escala en la estadística de la prueba. Si se desconoce el término de escala, se sustituye por una estimación basada en los datos disponibles. La estadística de prueba seguirá una distribución t de Student.
William Sealy Gosset introdujo la estadística t en 1908. Gosset era químico de la fábrica de cerveza Guinness de Dublín (Irlanda). La fábrica de cerveza Guinness tenía la política de contratar a los mejores licenciados de Oxford y Cambridge, seleccionando a aquellos que pudieran aportar aplicaciones de la bioquímica y la estadística a los procesos industriales establecidos de la empresa. William Sealy Gosset era uno de esos licenciados. En el proceso, William Sealy Gosset ideó la prueba t, que originalmente se concibió como una forma de controlar la calidad de la stout (la cerveza oscura que produce la fábrica) de forma rentable. Gosset publicó la prueba bajo el seudónimo de “Student” en Biometrika, hacia 1908. La razón del seudónimo fue la insistencia de Guinness, ya que la empresa quería mantener su política sobre la utilización de estadísticas como parte de sus “secretos comerciales”.
Los estadísticos de la prueba T suelen seguir la forma T = Z/s, donde Z y s son funciones de los datos. La variable Z está diseñada para ser sensible a la hipótesis alternativa: efectivamente, la magnitud de la variable Z es mayor cuando la hipótesis alternativa es cierta. Mientras tanto, “s” es un parámetro de escala que permite determinar la distribución de T. Los supuestos subyacentes a una prueba t son que a) Z sigue una distribución normal estándar bajo la hipótesis nula: b) ps2 sigue una distribución χ2 con p grados de libertad bajo la hipótesis nula (donde p es una constante positiva): y c) el valor Z y el valor s son independientes. En un tipo específico de prueba t, estas condiciones son consecuencias de la población estudiada, así como de la forma en que se muestrean los datos.
Por otro lado, el análisis de la varianza (ANOVA) es un conjunto de modelos estadísticos. Aunque los principios del ANOVA han sido utilizados por investigadores y estadísticos durante mucho tiempo, no fue hasta 1918 cuando Sir Ronald Fisher hizo una propuesta para formalizar el análisis de la varianza en un artículo titulado “La correlación entre parientes en el supuesto de la herencia mendeliana”. Desde entonces, el ANOVA ha ido ampliando su alcance y aplicación. En realidad, ANOVA es una denominación errónea, ya que no se deriva de las diferencias de varianzas, sino de las diferencias entre medias de grupos. Incluye los procedimientos asociados en los que la varianza observada en una variable concreta se divide en componentes atribuibles a distintas fuentes de variación.
Esencialmente, un ANOVA proporciona una prueba estadística para determinar si las medias de varios grupos son todas iguales y, como resultado, generaliza la prueba t a más de dos grupos. Un ANOVA puede ser más útil que una prueba t de dos muestras, ya que tiene menos posibilidades de cometer un error de tipo I. Por ejemplo, tener múltiples pruebas t de dos muestras tendría más posibilidades de cometer un error que un ANOVA de las mismas variables implicadas para obtener la media. El modelo es el mismo y el estadístico de prueba es el cociente F. En términos más sencillos, las pruebas t no son más que un caso especial de ANOVA: hacer un ANOVA tendrá el mismo resultado que múltiples pruebas t. Hay tres clases de modelos ANOVA: a) Modelos de efectos fijos, que suponen que los datos proceden de poblaciones normales, que solo difieren en sus medias: b) Modelos de efectos aleatorios, que suponen que los datos describen una jerarquía de poblaciones variables cuyas diferencias están limitadas por la jerarquía: y c) Modelos de efectos mixtos, que son situaciones en las que están presentes tanto los efectos fijos como los aleatorios.
Resumen:
1. La prueba t se utiliza para determinar si dos medias o promedios son iguales o diferentes. Se prefiere el ANOVA cuando se comparan tres o más medias o promedios.
2. Una prueba t tiene más probabilidades de cometer un error cuantas más medias se utilicen, por eso se utiliza ANOVA cuando se comparan dos o más medias.