Portada » Magisterio » Conceptos Fundamentales en Diseños Experimentales y Modelos Estadísticos
El Análisis de Varianza (ANOVA), por sus siglas en inglés (Analysis of Variance), es una colección de modelos estadísticos y sus procedimientos asociados que permiten comparar medias separando la varianza global observada en diferentes componentes. Es decir, es una técnica utilizada para comprobar si existen diferencias significativas entre los promedios de los tratamientos.
Es un esquema, una ecuación, un diagrama o una teoría que simplifica una parte compleja de las matemáticas, facilitando su comprensión y englobando de manera general diversos aspectos.
Son una cantidad que permite introducir una corrección matemática en los cálculos estadísticos debido a restricciones impuestas en los datos.
En este diseño, el experimentador asigna las unidades experimentales a los tratamientos de forma aleatoria. La única restricción es el número de observaciones que se toman en cada tratamiento. De hecho, si ni es el número de observaciones en el i-ésimo tratamiento (i = 1, …, k), entonces los valores n1, n2, …, nk determinan por completo las propiedades estadísticas del diseño. Naturalmente, este tipo de diseño se utiliza en experimentos que no incluyen factores de bloqueo.
Es un diseño estadístico en el que las unidades experimentales se dividen en bloques basándose en una variable externa (factor de bloqueo), para asegurar que los diversos grupos experimentales y de control se comparan de manera más precisa respecto a esa variable, reduciendo la variabilidad no deseada.
Es un arreglo de t símbolos en t2 celdas, dispuestas en un cuadrado de t filas y t columnas, de tal forma que cada símbolo aparece una sola vez en cada fila y en cada columna. El término t se conoce como el orden del cuadrado latino. En un cuadrado latino, las unidades experimentales o niveles de un factor se asignan de forma aleatoria, sujetas a la restricción de que cada nivel de un factor se utiliza una vez en cada nivel de los otros dos factores. Un cuadrado latino K × K es una disposición de K letras en una matriz K × K de forma que todas las letras aparecen una vez en cada fila y una vez en cada columna.
Se les conoce como diseños «reductores de ruido» porque permiten controlar la variabilidad experimental, es decir, las fuentes de variación no relacionadas con los tratamientos que podrían enmascarar los efectos reales. El Diseño de Cuadrado Latino controla dos fuentes de variación problemáticas (además del tratamiento), mientras que el Diseño de Bloques al Azar controla una única fuente de variación externa. Al aislar y reducir el impacto de estas fuentes de variabilidad, se mejora la precisión de la estimación de los efectos del tratamiento y la potencia de las pruebas estadísticas.
La distinción entre modelos de efectos fijos y modelos de efectos aleatorios es crucial en la estadística experimental, especialmente en el contexto de los modelos lineales y el ANOVA.
Cuando los niveles del factor son seleccionados específicamente por el experimentador, el interés del experimento se centra en conocer los efectos sobre la respuesta de estos niveles particulares. En este caso, los efectos del factor son «constantes» desconocidas (parámetros). El modelo de efectos fijos en el contexto de la varianza se aplica a situaciones en las que el experimentador ha sometido al grupo o material a varios factores, cada uno de los cuales afecta únicamente a la media, asumiendo que la variable respuesta mantiene una distribución normal.
Ejemplo: Se asume que existen cinco poblaciones fijas (ej., sin tratamiento, con poca sal, sin sal, etc.), de las cuales se han extraído las muestras. Si se repitiera el estudio, las muestras corresponderían a las mismas poblaciones o niveles específicos.
Los modelos de efectos aleatorios se utilizan cuando los niveles del factor son una muestra aleatoria de una población más grande de niveles. En estos modelos, el interés radica en medir la variabilidad existente en la totalidad de los efectos de la población de niveles, no en los niveles específicos observados. Se usan para describir situaciones en las que existen diferencias inherentes e incomparables en el material o grupo experimental.
Ejemplo: Un investigador está interesado en determinar el contenido y sus variaciones de grasas en las células hepáticas de cobayas; toma 5 cobayas al azar de un animalario y les realiza 3 biopsias hepáticas a cada una. Si se repitiera el estudio, las muestras provendrían de una selección aleatoria de una población más grande de cobayas.
Aunque las suposiciones iniciales y los propósitos de ambos modelos son diferentes, los cálculos y las pruebas de significación son a menudo similares, difiriendo principalmente en la interpretación y en algunas pruebas de hipótesis suplementarias. El objetivo es distinto del caso de efectos fijos y, por consiguiente, la planificación y el análisis difieren en ambos modelos.
Para que los resultados de un Análisis de Varianza (ANOVA) sean válidos y fiables, se deben cumplir ciertas suposiciones sobre los datos: