Portada » Matemáticas » Conceptos Clave de Estadística Descriptiva: Medidas y Coeficientes
La estadística es una disciplina que se ocupa de los métodos y procedimientos para recoger, clasificar, resumir, hallar regularidades y analizar datos. Su objetivo principal es manejar la variabilidad e incertidumbre inherentes a los fenómenos, permitiendo hacer inferencias, tomar decisiones informadas y formular predicciones.
Los métodos fundamentales para el tratamiento estadístico de los datos incluyen:
En estadística, es crucial diferenciar entre los valores que describen una población completa y los que describen una muestra de esa población.
Cuando un estadístico se utiliza para estimar o inferir un parámetro poblacional, se le denomina estimador. Generalmente, nos interesa conocer un parámetro, pero debido a la dificultad o imposibilidad de estudiar a toda la población, calculamos un estimador a partir de una muestra representativa.
Las medidas estadísticas descriptivas se clasifican en diferentes categorías según el aspecto de la distribución que valoran:
Describen la tendencia central de los datos, es decir, los valores alrededor de los cuales se agrupan las observaciones.
Son valores que dividen un conjunto de datos ordenado en partes iguales, indicando la posición relativa de una observación dentro de la distribución.
Se define el cuantil de orden a (con 0 < a < 1) como el valor que deja por debajo o igual a él una proporción a de las observaciones (es decir, aN de las observaciones).
Indican cómo se distribuyen los datos respecto a la tendencia central, midiendo la variabilidad o dispersión de las observaciones.
La dispersión de una variable aleatoria puede analizarse a partir de la media o la desviación típica. Sin embargo, limitarse a estos dos parámetros puede presentar inconvenientes, especialmente al comparar muestras o variables con diferentes unidades de medida.
Estos inconvenientes resaltan la necesidad de una herramienta que permita realizar comparaciones de dispersión de manera fiable, evitando resultados erróneos o engañosos.
El Coeficiente de Variación (CV) es una medida de dispersión relativa que permite comparar la variabilidad entre conjuntos de datos con diferentes unidades o medias muy distintas.
Ejemplo: Si la media es 80 y la desviación típica es 20, entonces CV = 20 / 80 = 0.25 = 25% (variabilidad relativa).
Ejemplo: Si el peso tiene un CV del 30% y la altura tiene un CV del 10%, los individuos presentan más dispersión en peso que en altura.
Estas medidas valoran la forma de la distribución de los datos, específicamente su simetría y su apuntamiento.
Evalúan la simetría o inclinación de la distribución de los datos respecto a su eje central. Una distribución estadística es simétrica si su representación gráfica (diagrama de barras, histograma o polígono de frecuencias) lo es. En caso contrario, es asimétrica.
Existen diferentes estadísticos para cuantificar la asimetría:
Ap = (Media - Moda) / Desviación Típica
g1 = m3 / s3
(donde m3 es el tercer momento central y s es la desviación típica)
Tratan de valorar la «estilización» o el grado de concentración de la representación gráfica de una distribución estadística alrededor de sus valores centrales y en sus extremos. Tienen sentido para funciones acampanadas, distribuciones simétricas o ligeramente asimétricas.
Para cuantificar la curtosis, se utilizan coeficientes específicos:
g2 = (m4 / s4) - 3
(donde m4 es el cuarto momento central y s es la desviación típica)
g2 > 0
: La distribución es leptocúrtica.g2 = 0
: La distribución es mesocúrtica (similar a una distribución normal).g2 < 0
: La distribución es platicúrtica.SC = (Q3 - Q1) / (2 * (P90 - P10))
Donde Q1 y Q3 son el primer y tercer cuartil, y P10 y P90 son el percentil 10 y 90, respectivamente.
SC < 0.263
: La distribución es leptocúrtica.SC = 0.263
: La distribución es mesocúrtica (similar a una distribución normal).SC > 0.263
: La distribución es platicúrtica.