Muestreo

 

1 En una fábrica que consta de 600 trabajadores queremos tomar una muestra de 20. Sabemos que hay 200 trabajadores en la sección A, 150 en la B, 150 en la C y 100 en la D.

 

Si se decide utilizar un muestreo estratificado con asignación proporcional, ¿qué tamaño tendrá cada estrato?

 

Denotemos como N al tamaño de la población y n al tamaño de la muestra. Similarmente, denotamos como N_h al tamaño del estrato h y n_h al tamaño de muestra que tomamos de h. De este modo, cuando tenemos asignación proporcional, se cumple

 

\displaystyle \frac{n_h}{N_h} = \frac{n}{N}

 

El problema se trata únicamente de encontrar los valores n_h para cada estrato. Observemos que ya conocemos el tamaño de la población N = 600; los tamaños de cada estrato N_A = 200, N_B = 150, N_C = 150 y N_D = 100.

 

Además, sabemos que n, por lo que ya tenemos todos los datos para calcular el tamaño de muestra para cada estrato. Primero despejamos n_h:

 

\displaystyle n_h = N_h \cdot \frac{n}{N}

 

Así, para la sección A debemos tomar:

 

\displaystyle n_A = 200 \cdot \frac{20}{600} = 6,66 \approx 7.

 

Para la sección B:

 

\displaystyle n_B = 150 \cdot \frac{20}{600} = 5.

 

Para la sección C:

 

\displaystyle n_C = 150 \cdot \frac{20}{600} = 5.

 

Por último, para la sección D:

 

\displaystyle n_D = 100 \cdot \frac{20}{600} = 3,33 \approx 3.

 

Por último, verificamos que

 

\displaystyle n_A + n_B + n_C + n_D = 7 + 5 + 5 + 3 = 20

 

2 En cierta cadena de centros comerciales trabajan 150 personas en el departamento de personal, 450 en el departamento de ventas, 200 en el departamento de contabilidad y 100 en el departamento de atención al cliente. Con objeto de realizar una encuesta laboral, se quiere seleccionar una muestra de 180 trabajadores.

 

a ¿Qué tipo de muestreo deberíamos utilizar para la selección de la muestra si queremos que incluya a trabajadores de los cuatro departamentos mencionados?

 

b ¿Qué número de trabajadores tendríamos que seleccionar en cada departamento si utilizamos asignación proporcional?

 

a El muestreo estratificado (con o sin asignación proporcional) es el único que nos garantiza que tomaríamos trabajadores de los cuatro departamentos.

 

b El procedimiento es similar al de los ejercicios anteriores. Primero, el tamaño de la población es

 

\displaystyle N = 150 + 450 + 200 + 100 = 900

 

y el tamaño de muestra es n = 180. Así, el número de trabajadores del departamento de personal que debemos escoger es

 

\displaystyle n_1 = 150 \cdot \frac{180}{900} = 30,

 

el número del departamento de ventas es

 

\displaystyle n_2 = 450 \cdot \frac{180}{900} = 90,

 

el número del departamento de contabilidad es

 

\displaystyle n_3 = 200 \cdot \frac{180}{900} = 40,

 

y el número de trabajadores que debemos tomar del departamento de atención al cliente es

 

\displaystyle n_4 = 100 \cdot \frac{180}{900} = 20.

 

Probabilidad de las muestras

 

3 Considera la siguiente población: \{22, 24, 26 \}.

 

a Escriba todas las muestras posibles de tamaño dos, escogidas mediante muestreo aleatorio simple y sin reemplazo.

 

b Calcule la varianza de la población.

 

c Calcula la varianza de las medias muestrales de las muestras de tamaño dos.

 

a Las posible muestras son todos los posibles subconjuntos de la población. Es decir,

 

\displaystyle M_1 = \{ 22, 24\}, M_2 = \{ 22, 26 \}, M_3 = \{ 24, 26\}

 

b Para calcular la varianza necesitamos calcular primero la media de la población, que es

 

\displaystyle \mu = \frac{22 + 24 + 26}{3} = 24

 

Así, la varianza es

 

    \begin{align*} \sigma^2 & = \frac{(22 - 24)^2 + (24 - 24)^2 + (26 - 24)^2}{3}\\& = \frac{2^2 + 0^2 + 2^2}{3}\\& = \frac{4 + 4}{3} = \frac{8}{3}\end{align*}

 

c Recordemos que las medias posibles pueden verse como otra población. Debido a que las posibles muestras son M_1, M_2 y M_3, entonces tenemos tres posibles medias muestrales:

 

\displaystyle \mu_{M_1} = 23, \mu_{M_2} = 24, \mu_{M_3} = 25

 

es decir, la población de medias muestrales (para muestras de tamaño dos) es

 

\displaystyle M = \{ 23, 24, 25\}

 

Debemos calcular la varianza de M. Para ello, primero calculamos su media:

 

\displaystyle \mu_M = \frac{23 + 24 + 25}{3} = 24

 

Por lo que la varianza es

 

    \begin{align*} \sigma_M^2 & = \frac{(23 - 24)^2 + (24 - 24)^2 + (25 - 24)^2}{3}\\& = \frac{1^2 + 0^2 + 1^2}{3}\\& = \frac{1 + 1}{3} = \frac{2}{3}\end{align*}

 

Observemos que la varianza de las medias es menor que la varianza de la población original.

 

4 La variable altura de las alumnas que estudian en una escuela de idiomas sigue una distribución normal de media 1,62 m y la desviación típica 0,12 m. ¿Cuál es la probabilidad de que la media de una muestra aleatoria de 100 alumnas sea mayor que 1.60 m?

 

Este ejercicio se resuelve similar al problema anterior. Tenemos una variable aleatoria X que sigue una distribución normal, es decir,

 

\displaystyle X \sim N(1.62, 0.12),

 

entonces el promedio sigue también una distribución normal

 

\displaystyle \overline{X} \sim N \left( 1.62, \frac{0.12}{\sqrt{100}} \right) = N( 1.62, 0.012)

 

Así, la probabilidad se calcula utilizando

 

    \begin{align*} P(\overline{X} > 1.60) & = P\left( Z > \frac{1.60 - 1.62}{0.012} \right)\\& = P(Z > -1.666) = P(Z < 1.666)\end{align*}

 

En este caso, si utilizamos una tabla de distribución normal, el resultado sería

 

\displaystyle P(\overline{X} > 1.60) = 0.9515

 

mientras que si utilizamos un programa de computadora, el resultado que nos da es

 

\displaystyle P(\overline{X} > 1.60) = 0.9522

 

De nuevo, el resultado con programas de computadoras siempre es más preciso. Sin embargo, no importa el método que utilices, el resultado siempre es bastante cercano al real (notemos que los resultados son iguales en 2 cifras después del punto decimal).

 

5 Las bolsas de sal envasadas por una máquina tienen un peso promedio de \mu = 500 \text{ g} con una desviación estándar de \sigma = 35 \text{ g}. Las bolsas se empaquetaron en cajas de 100 unidades.

 

a Calcular la probabilidad de que la media de los pesos de las bolsas de un paquete sea menor que 495 g.

 

b Calcular la probabilidad de que una caja de 100 bolsas pese más de 51 kg.

 

a Para responder la primera pregunta, debemos recordar que el promedio de una muestra de tamaño n sigue aproximadamente una distribución normal (debido al teorema central del límite), es decir,

 

\displaystyle \overline{X} \sim N \left(\mu, \frac{\sigma}{\sqrt{n}} \right)

 

Por tanto, el promedio de las bolsas en cada caja seguirá una distribución

 

\displaystyle \overline{X} \sim N \left(500, \frac{35}{\sqrt{100}} \right) = N \left(500, 3.5 \right)

 

Así, para calcular la probabilidad utilizamos

 

    \begin{align*} P(\overline{X} < 495) & = P\left( Z < \frac{495 - 500}{3.5} \right)\\& = P( Z < -1.4286)\end{align*}

 

donde Z es una variable aleatoria con distribución normal estándar.

 

Esta probabilidad se puede calcular de varias maneras, por ejemplo, utilizar Excel o un lenguaje de programación como R.

 

Otra forma de calcular esta probabilidad, es utilizando una tabla de probabilidades de la distribución normal, para ello necesitamos escribir la probabilidad de la siguiente manera:

 

\displaystyle P( Z < -1.4286) = P( Z > 1.4286 ) = 1 - P( Z \leq 1.4286 )

 

y ya podemos buscar P( Z \leq 1.4286 ) en una tabla distribución normal, donde tenemos que P( Z \leq 1.43) = 0.9236 (es el valor más cercano, pues sólo tiene precisión de 2 cifras). Así,

 

\displaystyle P(\overline{X} < 495) = 1 - 0.9236 = 0.0764

 

Si utilizamos un lenguaje de programación, el resultado es

 

\displaystyle P(\overline{X} < 495) = 0.07656

 

que es bastante similar.

 

b Este inciso es similar al anterior. La única diferencia es que ahora la variable aleatoria es la suma de los 100 elementos de la muestra. En este caso, por el teorema central del límite, tenemos

 

\displaystyle Y = \sum_{i = 1}^{100}{X_i} \sim N(500 \cdot 100, 35\sqrt{100}) = N(50\; 000, 350)

 

donde Y es el peso de la caja en gramos. De este modo, la probabilidad que buscamos es P(Y < 51\;000), pues 51 kg es igual a 51 000 g.

 

    \begin{align*} P(Y > 51\;000) & = P\left( Z > \frac{51\; 000 - 50\; 000}{350} \right)\\& = P( Z > 2.8571)\\& = 1 - P(Z \leq 2.8571).\end{align*}

 

Así, si utilizamos una tabla de distribución normal, el resultado es

 

\displaystyle P(Y > 51\;000) = 0.0021

 

mientras que si utilizamos una Excel o un lenguaje de programación, el resultado da

 

\displaystyle P(Y > 51\;000) = 0.00213

 

Recordemos que el resultado obtenido con computadora es más preciso.

 

Pruebas de hipótesis con estadístico de prueba

 

6 En una fábrica de componentes electrónicos, la proporción de componentes finales defectuosos era del 20%. Tras una serie de operaciones e inversiones destinadas a mejorar el rendimiento se analizó una muestra aleatoria de 500 componentes, encontrándose que 90 de ellos eran defectuosos. ¿Qué nivel de confianza debe adoptarse para aceptar que el rendimiento no ha sufrido variaciones?

 

Para determinar el nivel de confianza, primero debemos observar que se trata de una prueba de hipótesis sobre comparación de proporciones.

 

Así, la hipótesis nula es (donde p_0 = 0.2)

 

\displaystyle H_0: p = 0.2

 

mientras que la hipótesis alternativa es

 

\displaystyle H_A: p \neq 0.2

 

Al realizar el muestreo, obtuvimos que n = 500, x = 90 y

 

\displaystyle \hat{p} = \frac{90}{500} = 0.18

 

En este caso, el estadístico de prueba es

 

\displaystyle z_0 = \frac{x - np_0}{\sqrt{np_0(1 - p_0)}} = \frac{-10}{\sqrt{80}} = -1.1180

 

donde z_0 sigue una distribución normal estándar. De este modo, para aceptar la hipótesis nula (esto es, aceptar que no ha habido variación en el rendimiento), basta con que |z_0| \leq Z_{\alpha/2} donde 1 - \alpha es el nivel de confianza.

 

Así, es suficiente con tomar Z_{\alpha/2} = 1.1180 para aceptar la hipótesis nula. Luego,

 

\displaystyle 1 - \alpha = P(Z \leq 1.1180) - P(Z \leq - 1.1180) = 0.7364

 

Esto quiere decir que si tomamos un nivel de confianza tan bajo como 73.64%, ya es suficiente para aceptar que el rendimiento no ha sufrido variaciones. Aunque la confianza puede ser del 80% o hasta el 99%.

 

Recordemos que aceptar la hipótesis nula, simplemente estamos diciendo que no hay evidencia suficiente para rechazarla.

 

Nota: Otra forma de probar la hipótesis es crear un intervalo de confianza a partir de \mu_0. Al ser la hipótesis bilateral, entonces el intervalo de confianza se calcula utilizando

 

\displaystyle p_0 \pm Z_{\alpha/2}\sqrt{\frac{p_0 (1 - p_0)}{n}} = 0.2 \pm Z_{\alpha/2} \cdot \sqrt{\frac{0.2 \cdot 0.8}{500}}

 

modo que el intervalo de confianza es

 

\displaystyle (0.2 - Z_{\alpha/2}*0.01788, 0.2 + Z_{\alpha/2}*0.01788)

 

para aceptar la hipótesis, se suficiente con que

 

\displaystyle 0.2 - Z_{\alpha/2}*0.01788 = 0.18

 

que al despejar Z_{\alpha/2} obtenemos

 

\displaystyle Z_{\alpha/2} = \frac{0.02}{0.01788} = 1.1180

 

que era justo lo que habíamos obtenido antes. De aquí se sigue que la confianza es de 73.64%.

 

7 Un sociólogo ha pronosticado, que en una determinada ciudad, el nivel de abstención en las próximas elecciones será del 40% como mínimo. Se elige al azar una muestra aleatoria de 200 individuos, con derecho a voto, 75 de los cuales estarían dispuestos a votar. Determinar con un nivel de significación del 1%, si se puede admitir el pronóstico.

 

En este caso, se trata de una prueba de hipótesis para la proporción. Sin embargo, ahora se trata de un contraste unilateral, pues hipótesis nula es

 

\displaystyle H_0 : p \geq 0.4

 

mientras que la hipótesis alternativa es

 

\displaystyle H_A : p < 0.4

 

donde p es la proporción de los individuos que se abstendrán en las próximas elecciones y p_0 = 0.4 es la proporción hipotética.

 

Así, el estadístico de prueba es

 

\displaystyle z_0 = \frac{x - np_0}{\sqrt{np_0 (1 - p_0)}}

 

donde n = 200, x = 200 - 75 = 125. Con esto, el estadístico toma el valor de

 

\displaystyle z_0 = 6.4952

 

Luego, debido a que se trata de un contraste unilateral, la hipótesis se rechaza si z_0 < -Z_{\alpha}. Luego, a \alpha = 0.01 le corresponde el valor crítico Z_{\alpha} = 2.3269. Así, como

 

\displaystyle z_0 = 6.4952 \geq -Z_{\alpha} = -2.3269

 

entonces aceptamos H_0.

 

Por tanto, podemos afirmar, con un nivel de significancia del 1% que la abstención será como mínimo del 40%.

 

Nota: si creamos un intervalo de confianza alrededor de p_0 (unilateral), el límite inferior sería

 

\displaystyle p_0 - Z_{\alpha} \sqrt{\frac{p_0(1-p_0)}{n}}

 

que, al sustituir, obtenemos

 

\displaystyle (0.3194, 1]

 

y como \hat{p} = 0.625 está en el intervalo de confianza, entonces aceptamos la hipótesis nula. Esta es una forma equivalente de realizar la prueba de hipótesis.

 

8 Un informe indica que el precio medio del billete de avión entre Canarias y Madrid es, como máximo, de 120 € con una desviación típica de 40 €. Se toma una muestra de 100 viajeros y se obtiene que la media de los precios de sus billetes es de 128 €.

 

¿Se puede aceptar, con un nivel de significación igual a 0,1, la afirmación de partida?

 

En esta prueba de hipótesis estamos probando si la media es menor o igual a cierto valor. Por tanto, la hipótesis nula es

 

\displaystyle H_0 : \mu \leq 120

 

y la hipótesis alternativa es

 

\displaystyle H_A : \mu > 120

 

donde \mu_0 = 120 es el valor hipotético. Al realizar el muestreo, obtuvimos \overline{X} = 128, n = 100 y \sigma = 40. Por tanto, nuestro estadístico de prueba es

 

\displaystyle t_0 = \frac{\overline{X} - \mu_0}{\sigma / \sqrt{n}}

 

que toma el valor de t_0 = 2.

 

Como se trata de un contraste unilateral, el criterio de rechazo de la hipótesis nula es t_0 > Z_{\alpha}. En este caso, a \alpha = 0.1 le corresponde un valor crítico de 1.2816.

 

Luego, como

 

\displaystyle t_0 = 2 > Z_{\alpha} = 1.2816

 

entonces rechazamos la hipótesis nula.

 

De este modo, concluimos que la media de los precios de los boletos de avión no es de 120 € como máximo. Tenemos evidencia para confirmar que la media es mayor a 120 euros.

 

Pruebas de hipótesis con intervalos de confianza

 

9 Un fabricante de lámparas eléctricas está ensayando un nuevo método de producción que se considerará aceptable si las lámparas obtenidas por este método dan lugar a una población normal de duración media 2400 horas, con una desviación típica igual a 300. Se toma una muestra de 100 lámparas producidas por este método y esta muestra tiene una duración media de 2320 horas. ¿Se puede aceptar la hipótesis de validez del nuevo proceso de fabricación con un riesgo igual o menor al 5%?

 

En este caso se trata de una prueba de hipótesis donde queremos verificar que la media sea igual a cierto valor. Por tanto, la hipótesis nula es

 

\displaystyle H_0 : \mu = 2400

 

y la hipótesis alternativa es

 

\displaystyle H_A : \mu \neq 2400

 

donde \mu_0 = 2400 es el valor hipotético.

 

Como estamos probando la media de la población, entonces el intervalo de confianza se construye mediante

 

\displaystyle \mu_0 \pm Z_{\alpha/2}\frac{S}{\sqrt{n}}

 

ya que el contraste es bilateral. Así, en el muestreo obtuvimos que \overline{X} = 2320, \mu_0 = 2400, S = 300 y n = 100. Luego, a la significancia de \alpha = 0.05 le corresponde un valor crítico de Z_{\alpha/2} = 1.96. Así, se tiene que el intervalo de confianza es

 

\displaystyle (2341.2, 2458.8)

 

y como \overline{X} = 2320 se encuentra fuera del intervalo de confianza, entonces rechazamos la hipótesis nula.

 

En consecuencia, concluimos que el nuevo proceso de fabricación no es aceptable.

 

10 El control de calidad una fábrica de pilas y baterías sospecha que hubo defectos en la producción de un modelo de batería para teléfonos móviles, bajando su tiempo de duración. Hasta ahora el tiempo de duración en conversación seguía una distribución normal con media 300 minutos y desviación típica 30 minutos. Sin embargo, en la inspección del último lote producido, antes de enviarlo al mercado, se obtuvo que de una muestra de 60 baterías el tiempo medio de duración en conversación fue de 290 minutos. Suponiendo que ese tiempo sigue siendo Normal con la misma desviación típica:

 

¿Se puede concluir que las sospechas del control de calidad son ciertas a un nivel de significación del 2%?

 

Como suponemos que el tiempo de vida se redujo, entonces se trata de una prueba de hipótesis donde queremos verificar que la media es menor a cierto valor. Así, la hipótesis nula es

 

\displaystyle H_0 : \mu \geq 300

 

y la hipótesis alternativa es

 

\displaystyle H_A : \mu < 300

 

donde \mu_0 = 300 es la media hipotética.

 

El intervalo de confianza para la media es

 

\displaystyle \mu_0 - Z_{\alpha} \frac{S}{\sqrt{n}}

 

y para esta muestra tenemos que \overline{X} = 290, \mu_0 = 300, n = 60 y S = 30. Al tratarse de un contraste unilateral, entonces sólo consideramos el límite inferior (ya que el superior será \infty). Además, para una significancia de \alpha = 0.02 el valor crítico asociado es Z_{\alpha} = 2.0537. Luego, tenemos que el intervalo de confianza es

 

\displaystyle (292.0461, \infty)

 

Y como \overline{X} = 290 no está dentro del intervalo de confianza, entonces el criterio de rechazo de cumple.

 

En consecuencia, rechazamos la hipótesis nula. Por tanto, aceptamos las sospechas del control de calidad de que el tiempo de duración de las baterías es menor a 300 minutos (con una confianza del 2%).

 

11 Se cree que el nivel medio de protombina en una población normal es de 20 mg/100 ml de plasma con una desviación típica de 4 miligramos/100 ml. Para comprobarlo, se toma una muestra de 40 individuos en los que la media es de 18.5 mg/100 ml. ¿Se puede aceptar la hipótesis, con un nivel de significación del 5%?

 

En este caso se trata de una prueba de hipótesis donde buscamos verificar que la media sea igual a cierto valor. De este modo, la hipótesis nula es

 

\displaystyle H_0 : \mu = 20

 

mientras que la hipótesis alternativa es

 

\displaystyle H_A : \mu \neq 20

 

donde el valor hipotético es \mu_0 = 20

 

Debido a que estamos haciendo una prueba para la media y siendo un contraste bilateral, el intervalo de confianza se calcula utilizando

 

\displaystyle \mu_0 \pm Z_{\alpha/2}\frac{S}{\sqrt{n}}

 

donde \overline{X} = 18.5, S = 4, n = 40 y \mu_0 = 20. Para la significancia de \alpha = 0.05 tenemos que Z_{\alpha/2} = 1.96. Por lo que el intervalo de confianza es

 

\displaystyle (18.7604, 21.2396)

 

Luego, como \overline{X} = 18.5 no está dentro del intervalo de confianza, entonces rechazamos la hipótesis nula.

 

Por tanto, concluimos que el nivel medio de protombina no es de 20 mg / 100 ml plasma.

 

¿Necesitas un/a profe de Matemáticas?

¿Te ha gustado el artículo?

¿Ninguna información? ¿En serio?Ok, intentaremos hacerlo mejor la próxima vezAprobado por los pelos. ¿Puedes hacerlo mejor?Gracias. Haznos cualquier pregunta en los comentar¡Un placer poder ayudarte! :) 5,00/5 - 8 voto(s)
Cargando…

Marta

➗ Licenciada en Químicas da clase de Matemáticas, Física y Química -> Comparto aquí mi pasión por las matemáticas ➗