Portada » Matemáticas » Conceptos Fundamentales de Muestreo Estadístico y Distribución Uniforme
A continuación, se revisan las características y aplicaciones de los principales métodos de muestreo probabilístico.
Estos dos métodos a menudo se confunden, pero sus estructuras de selección son distintas:
Ejemplo: Muestreo Estratificado
Suponemos que se está haciendo un estudio sobre el consumo de alimentos orgánicos en una ciudad de 100.000 habitantes. La variable edad se considera adecuada para obtener resultados en esta investigación. Se incluyen solamente los mayores de 40 años en el estudio. Se distribuyen en tres grupos o estratos, resultando una agrupación, según el censo:
Elección proporcional al tamaño del estrato: Para asignar el número de componentes a los tres estratos de edad, aplicaremos la fórmula anterior:
Sea $X$ la temperatura del aire al mediodía en el invernadero, con $X \sim U[18, 22]$. La función de densidad de una uniforme continua en $[a, b]$ es $f(x) = \frac{1}{b-a}$ para $a \le x \le b$. Con $a = 18$ y $b = 22$, la densidad es $f(x) = \frac{1}{22-18} = \frac{1}{4} = 0.25$ en $[18, 22]$.
Para variables continuas, $P(X = c) = 0$ para cualquier constante $c$. Por tanto, $P(X = 20,0) = 0$.
En una uniforme, la probabilidad es el área bajo la función de densidad:
$$P(18,5 \le X \le 20,0) = \frac{20,0 – 18,5}{22-18} = \frac{1,5}{4} = 0,375.$$
Sea $X$ el pH de la solución nutritiva en un sistema hidropónico, con $X \sim U[4, 5]$.
Los datos muestrales siguientes provienen de un experimento realizado en Catemito, donde se midió el crecimiento (en metros) de las raíces para árboles frutales. Los datos son los siguientes: $10, 8, 12, 15, 13, 11, 6, 5$.
Se calcula la media muestral ($\bar{x}$):
$$\bar{x} = \frac{10 + 8 + 12 + 15 + 13 + 11 + 6 + 5}{8} = \frac{80}{8} = 10 \text{ metros}.$$
La estimación puntual es $\bar{x} = 10$.
Se calcula la desviación estándar muestral ($s$):
$$s = \sqrt{\frac{\sum(x_i – \bar{x})^2}{n-1}}.$$
Cálculo de las desviaciones al cuadrado: $(10-10)^2 + (8-10)^2 + (12-10)^2 + (15-10)^2 + (13-10)^2 + (11-10)^2 + (6-10)^2 + (5-10)^2 = 0 + 4 + 4 + 25 + 9 + 1 + 16 + 25 = 84$.
$$s = \sqrt{\frac{84}{8-1}} = \sqrt{\frac{84}{7}} = \sqrt{12} \approx 3,464 \text{ metros}.$$
La estimación puntual es $s \approx 3,464$.
El personal de ventas de Veterquímica, en promedio, vende $8000 semanales. El gerente de la empresa propone un plan de compensaciones con nuevos incentivos de venta. Con esto espera que los resultados de un periodo de prueba le permitan concluir que el plan de compensaciones aumenta el promedio de ventas de los vendedores.
a) Establezca las hipótesis nula y alternativa adecuadas.
Respuesta:
b) En esta situación, ¿cuál es el error tipo I? ¿Qué consecuencia tiene cometer este error?
Respuesta: El error de Tipo I es rechazar $H_0$ cuando es cierta. Corresponde a la afirmación del investigador de que el nuevo plan de compensación mejora las ventas medias ($\mu > 8000$) cuando en realidad el nuevo plan no es mejor que el sistema actual ($\mu \le 8000$).
c) En esta situación, ¿cuál es el error tipo II? ¿Qué consecuencia tiene cometer este error?
Respuesta: El error de Tipo II es aceptar $H_0$ cuando es falsa. Corresponde a que el investigador concluye que el plan de compensación con nuevos incentivos de venta no es mejor que el sistema actual ($\mu \le 8000$), cuando en realidad el nuevo plan sí mejora la media de ventas por vendedor ($\mu > 8000$).
Un fabricante es proveedor de los ejes traseros para los tractores de una importante empresa agroindustrial. Estos ejes deben soportar $80.000$ libras por pulgada cuadrada ($\text{psi}$) en pruebas de carga, pero un eje excesivamente fuerte eleva los costos de producción de manera significativa, mientras que un eje excesivamente liviano causa inestabilidad de la máquina. La larga experiencia indica que la desviación estándar de la resistencia de sus ejes es $\sigma = 4.000 \text{ psi}$. El fabricante selecciona una muestra de $n = 100$ ejes de la producción, los prueba y encuentra que la capacidad de carga media de la muestra es $\bar{x} = 79.600 \text{ psi}$. Si el fabricante de ejes utiliza un nivel de confianza de $95\%$ para realizar una prueba de hipótesis, ¿satisfarán los ejes sus requerimientos de carga?
Pasos para probar la hipótesis:
1. Establecimiento de Hipótesis: Se busca verificar si la resistencia media es al menos $80.000 \text{ psi}$.
$$H_0: \mu = 80.000 \quad \text{o} \quad H_0: \mu \ge 80.000$$
$$H_A: \mu < 80.000 \quad \text{(Prueba unilateral izquierda)}$$
2. Nivel de Significación y Valor Crítico:
Nivel de confianza $= 95\% \implies \alpha = 0,05$. Como es una prueba unilateral izquierda (buscamos evidencia de que es menor), el valor crítico $Z_{\alpha}$ es el valor que deja el $5\%$ en la cola izquierda de la distribución normal estándar.
$$Z_{\text{crítico}} = -1,645$$
3. Cálculo del Estadístico de Prueba ($Z_{\text{calc}}$):
$$Z_{\text{calc}} = \frac{\bar{x} – \mu_0}{\sigma / \sqrt{n}} = \frac{79.600 – 80.000}{4.000 / \sqrt{100}} = \frac{-400}{4.000 / 10} = \frac{-400}{400} = -1$$
4. Regla de Decisión y Conclusión:
La región de rechazo es $Z < -1,645$.
Como $Z_{\text{calc}} = -1$ y $-1 > -1,645$, el valor cae en la región de aceptación.
Conclusión: No se debe rechazar $H_0$. El fabricante debe aceptar que la corrida de producción reúne los requisitos de carga, ya que la evidencia muestral no es lo suficientemente fuerte (al nivel de significancia del $5\%$) para concluir que la resistencia media es inferior a $80.000 \text{ psi}$.
