Muestreo

 

1 En cierto barrio se quiere hacer un estudio para conocer mejor el tipo de actividades de ocio que gustan más a sus habitantes. Para ello van a ser encuestados 100 individuos elegidos al azar.

 

a Explicar qué procedimiento de selección sería más adecuado utilizar: muestreo con o sin reposición. ¿Por qué?

 

b Como los gustos cambian con la edad y se sabe que en el barrio viven 2.500 niños, 7.000 adultos y 500 ancianos, posteriormente se decide elegir la muestra anterior utilizando un muestreo estratificado con asignación proporcional. Determinar el tamaño muestral correspondiente a cada estrato.

 

a Como la población es finita, entonces hacer muestreo con reemplazo nos permitirá utilizar las fórmulas que hemos estudiado.

 

Sin embargo, es posible hacer muestreo sin reemplazo, con el único inconveniente que los cálculos serán un poco más complicados.

 

b Sea N = 10.000 el tamaño de la población y n = 100 el tamaño de la muestra. Denotaremos como N_h al tamaño del estrato h y n_h al tamaño de muestra que tomamos de h. En el muestreo estratificado con asignación proporcional se cumple que

 

\displaystyle \frac{n_h}{N_h} = \frac{n}{N} \quad \Longrightarrow \quad n_h = N_h \cdot \frac{n}{N}

 

Por lo que debemos encontrar los valores n_h para cada estrato. Notemos que los tamaños de cada estrato N_A = 2.500 (niños), N_B = 7.000 (adultos) y N_C = 500 (ancianos).

 

Así, el tamaño de muestra de niños es:

 

\displaystyle n_A = 2.500 \cdot \frac{100}{10.000} = 25.

 

El tamaño de muestra de adultos es:

 

\displaystyle n_B = 7.000 \cdot \frac{100}{10.000} = 70.

 

Por último, el tamaño de muestra de ancianos es:

 

\displaystyle n_C = 500 \cdot \frac{100}{10.000} = 5.

 

Observamos que los tamaños de muestra suman 100:

 

\displaystyle n_A + n_B + n_C = 25 + 70 + 5 = 100

 

La plataforma que conecta profes particulares y estudiantes
¡1a clase gratis!
Francisco javier
5
5 (24 opiniones)
Francisco javier
Matemáticas
10€
/h
¡1a clase gratis!
José arturo
4,9
4,9 (32 opiniones)
José arturo
Matemáticas
12€
/h
¡1a clase gratis!
José angel
4,9
4,9 (70 opiniones)
José angel
Matemáticas
5€
/h
¡1a clase gratis!
Fátima
5
5 (11 opiniones)
Fátima
Matemáticas
12€
/h
¡1a clase gratis!
Alex
5
5 (41 opiniones)
Alex
Matemáticas
12€
/h
¡1a clase gratis!
Santiago
5
5 (20 opiniones)
Santiago
Matemáticas
9€
/h
¡1a clase gratis!
Julio
5
5 (93 opiniones)
Julio
Matemáticas
14€
/h
¡1a clase gratis!
Amin
5
5 (50 opiniones)
Amin
Matemáticas
10€
/h
¡1a clase gratis!
Francisco javier
5
5 (24 opiniones)
Francisco javier
Matemáticas
10€
/h
¡1a clase gratis!
José arturo
4,9
4,9 (32 opiniones)
José arturo
Matemáticas
12€
/h
¡1a clase gratis!
José angel
4,9
4,9 (70 opiniones)
José angel
Matemáticas
5€
/h
¡1a clase gratis!
Fátima
5
5 (11 opiniones)
Fátima
Matemáticas
12€
/h
¡1a clase gratis!
Alex
5
5 (41 opiniones)
Alex
Matemáticas
12€
/h
¡1a clase gratis!
Santiago
5
5 (20 opiniones)
Santiago
Matemáticas
9€
/h
¡1a clase gratis!
Julio
5
5 (93 opiniones)
Julio
Matemáticas
14€
/h
¡1a clase gratis!
Amin
5
5 (50 opiniones)
Amin
Matemáticas
10€
/h
Ver todos los profes>

Intervalos de confianza

 

2 Se ha tomado una muestra de los precios de un mismo producto alimenticio en 16 comercios, elegidos al azar en un barrio de una ciudad, y se han encontrado los siguientes precios:

 

95, 108, 97, 112, 99, 106, 105, 100, 99, 98, 104, 110, 107, 111, 103, 110.

 

Suponiendo que los precios de este producto siguen una distribución normal de varianza 25 y media desconocida:

 

a ¿Cuál es la distribución de la media muestral?

 

b Determine el intervalo de confianza, al 95%, para la media poblacional.

 

a Denotemos la media desconocida como \mu. Como los precios vienen de una distribución normal, entonces la media muestral también sigue una distribución muestral con media \mu, y varianza 25/16.

 

b Para determinar el intervalo de confianza, primero encontramos la media de la muestra:

 

\displaystyle \overline{X} = \frac{95 + 108 + 97 + \cdots + 110}{16} = 104

 

por lo que la fórmula es

 

\displaystyle \overline{X} \pm t_{\alpha/2} \cdot \frac{\sigma}{\sqrt{n}}

 

donde t_{\alpha/2} = 2.1315 viene de una distribución t-Student con n - 1 = 15 grados de libertad. Así, el intervalo de confianza es

 

\displaystyle \left( 104 - 2.1315 \cdot \frac{\sqrt{25}}{\sqrt{16}}, 104 + 2.1315 \cdot \frac{\sqrt{25}}{\sqrt{16}} \right)

 

es decir,

 

\displaystyle (101.3357, 106.6643)

 

3 La media de las estaturas de una muestra aleatoria de 400 personas de una ciudad es 1,75 m. Se sabe que la estatura de las personas de esa ciudad es una variable aleatoria que sigue una distribución normal con varianza \sigma^2 = 0,16 \text{ m}^2.

 

a Construye un intervalo, de un 95% de confianza, para la media de las estaturas de la población.

 

b ¿Cuál sería el mínimo tamaño muestral necesario para que pueda decirse que la verdadera media de las estaturas está a menos de 2 cm de la media muestral, con un nivel de confianza del 90%?

 

a Como la muestra consiste de 400 personas, entonces para calcular el intervalo de confianza, utilizamos la fórmula:

 

\displaystyle \overline{X} \pm Z_{\alpha/2} \cdot \frac{\sigma}{\sqrt{n}}

 

donde Z_{\alpha/2} = 1.96 es el valor crítico de una distribución normal estándar.

 

Además, \overline{X} = 400, n = 400 y \sigma^2 = 0.16. De aquí se sigue que \sigma = 0.4.

 

Así, el intervalo de confianza es

 

\displaystyle \left( 1.75 - 1.95 \cdot \frac{0.4}{\sqrt{400}}, 1.75 + 1.95 \cdot \frac{0.4}{\sqrt{400}} \right) = (1.7108, 1.7892)

 

b Para encontrar el tamaño muestral utilizaremos Z_{\alpha/2} donde \alpha = 0.1, por lo que Z_{\alpha/2} = 1.6449.

 

\displaystyle 1.6449 \cdot \frac{0.4}{\sqrt{n}} < 0.02 \quad \Longrightarrow \quad \frac{0.4}{\sqrt{n}} < \frac{0.02}{1.6449}

 

Así, al despejar \sqrt{n} tenemos

 

\displaystyle \sqrt{n} > 0.4 \cdot \frac{1.6449}{0.02} = 32.898

 

Por lo que n > 1082.2784. Es decir, el tamaño de muestra debe ser al menos de n = 1083 personas.

 

4 Las ventas mensuales de una tienda de electrodomésticos siguen una distribución normal, con desviación típica 900 €. En un estudio estadístico de las ventas realizadas en los últimos nueve meses, se ha encontrado un intervalo de confianza para la media mensual de las ventas, cuyos extremos son 4 663 € y 5 839 €.

 

a ¿Cuál ha sido la media de las ventas en estos nueve meses?

 

b ¿Cuál es el nivel de confianza para este intervalo?

 

a Cuando calculamos el intervalo de confianza de la media de una distribución normal, la media siempre se encontrará a la mitad del intervalo. Por lo tanto, la media es

 

\displaystyle \overline{X} = \frac{4663 + 5839}{2} = 5251

 

Esto es, la media fue de 5 251 €.

 

b Tenemos que n = 9, \overline{X} = 5251 y \sigma = 900. De aquí se sigue que el límite inferior se calculó utilizando

 

\displaystyle 5251 - Z_{\alpha/2}\cdot \frac{900}{\sqrt{9}} = 4663

 

Es decir,

 

\displaystyle Z_{\alpha/2}\cdot \frac{900}{\sqrt{9}} = 5251 - 4663 = 588

 

Por lo que

 

\displaystyle Z_{\alpha/2} = 588 \cdot \frac{3}{900} = 1.96

 

De aquí se sigue que 1 - \alpha = 0.95, por lo que el nivel de confianza fue de 95%.

 

5 Se desea estimar la proporción p de individuos daltónicos de una población a través del porcentaje observado en una muestra aleatoria de individuos, de tamaño n.

 

a Si el porcentaje de individuos daltónicos en la muestra es igual al 30%, calcula el valor de n para que, con un nivel de confianza de 0,95, el error cometido en la estimación sea inferior al 3,1%.

 

b Si el tamaño de la muestra es de 64 individuos, y el porcentaje de individuos daltónicos en la muestra es del 35%, determina, usando un nivel de significación del 1%, el correspondiente intervalo de confianza para la proporción de daltónicos de la población.

 

a El intervalo de confianza para una proporción se calcula con la fórmula

 

\displaystyle p \pm Z_{\alpha/2}\sqrt{\frac{p(1 - p)}{n}}

 

como deseamos una confianza del 95%, entonces Z_{\alpha/2} = 1.96. Así, tenemos que

 

\displaystyle 1.96 \sqrt{\frac{0.3 \cdot 0.7}{n}} < 0.031

 

Despejando, tenemos que

 

\displaystyle \sqrt{n} > 1.96 \cdot \frac{\sqrt{0.3 \cdot 0.7}}{0.031} = 28.9737

 

Por lo que n > 839.48. Es decir, el tamaño de muestra debe ser de al menos 840 individuos.

 

b Para encontrar el intervalo de confianza, simplemente reemplazamos en

 

\displaystyle p \pm Z_{\alpha/2}\sqrt{\frac{p(1 - p)}{n}}

 

los datos de p = 0.35, n = 64. Notemos que \alpha = 0.01, por lo que Z_{\alpha/2} = 2.58. Con esto, el intervalo de confianza es

 

\displaystyle \left( 0.35 - 2.58 \sqrt{\frac{0.35 \cdot 0.65}{64}}, 0.35 + 2.58 \sqrt{\frac{0.35 \cdot 0.65}{64}} \right)

 

es decir,

 

\displaystyle (0.1964, 0.5036)

 

6 En una población una variable aleatoria sigue una distribución normal de media desconocida y desviación típica 2.

 

a Observada una muestra de tamaño 400, tomada al azar, se ha obtenido una media muestral igual a 50. Calcule un intervalo, con el 97% de confianza, para la media de la población.

 

b Con el mismo nivel de confianza, ¿qué tamaño mínimo debe tener la muestra para qué la amplitud del intervalo que se obtenga sea, como máximo, 1?

 

Tenemos que n = 400, \sigma = 2 y \mu es desconocida.

 

a Como n > 30, entonces la distribución de la media se puede aproximar bien con una distribución normal. Por tanto, utilizamos la fórmula

 

\displaystyle \overline{X} \pm Z_{\alpha/2} \cdot \frac{\sigma}{\sqrt{n}}

 

donde \alpha = 0.03. Así, Z_{\alpha/2} = 2.1701. Por lo tanto, el intervalo de confianza es

 

\displaystyle \left( 50 - 2.1701 \cdot \frac{2}{\sqrt{400}}, 50 + 2.1701 \cdot \frac{2}{\sqrt{400}} \right)

 

es decir,

 

\displaystyle (49.7830, 50.2170)

 

b Como se tiene el mismo nivel de confianza, entonces Z_{\alpha/2} = 2.1701. Luego, para que la amplitud del intervalo sea 1, debemos tener que

 

\displaystyle 0.5 > Z_{\alpha/2} \cdot \frac{\sigma}{\sqrt{n}} = 2.1701 \cdot \frac{2}{\sqrt{n}}

 

de donde despejaremos n

 

\displaystyle \sqrt{n} > 2.1701 \cdot \frac{2}{0.5} = 8.6804

 

es decir n > 75.3487. Por lo tanto, el tamaño de muestra debe ser de al menos 76 individuos.

 

7 El tiempo que tardan las cajeras de un supermercado en cobrar a los clientes sigue una distribución normal con media desconocida y desviación típica 0,5 minutos. Para una muestra aleatoria de 25 clientes se obtuvo un tiempo medio de 5,2 minutos.

 

a Calcula el intervalo de confianza al nivel del 95% para el tiempo medio que se tarda en cobrar a los clientes.

 

b Indica el tamaño muestral necesario para estimar dicho tiempo medio con un el error de \pm 0,5 minutos y un nivel de confianza del 95%.

 

a Como la muestra consiste de 25 clientes, entonces para calcular el intervalo de confianza, utilizamos la fórmula:

 

\displaystyle \overline{X} \pm t_{\alpha/2} \cdot \frac{\sigma}{\sqrt{n}}

 

donde t_{\alpha/2} es el valor crítico tal que P(-t_{\alpha/2} \leq T \leq t_{\alpha/2}) = 0.95 donde T es una variable aleatoria que sigue una distribución t-Student con 24 grados de libertad.

 

El valor de t_{\alpha/2} lo podemos obtener de una tabla de distribución t, o utilizando un software. El resultado es t_{\alpha/2} = 2.0639

 

Así, el intervalo de confianza es

 

\displaystyle \left( 5.2 - 2.0639 \cdot \frac{0.5}{\sqrt{25}}, 5.2 + 2.0639 \cdot \frac{0.5}{\sqrt{25}} \right) = (4.9936, 5.4064)

 

b Para encontrar el tamaño muestral reemplazaremos t_{\alpha/2} por Z_{\alpha/2}, el cual proviene de una distribución normal estándar. Como el error debe ser \pm 0.5, entonces se debe tener

 

\displaystyle 0.5 = Z_{\alpha/2} \cdot \frac{0.5}{\sqrt{n}}

 

donde Z_{\alpha/2} = 1.96. Así, al despejar n tenemos

 

\displaystyle \sqrt{n} = 1.96 \quad \Longrightarrow \quad n = 3.8415

 

es decir, el tamaño de muestra debe ser al menos de n = 4.

 

8 La cantidad de hemoglobina en sangre del hombre sigue una distribución normal con una desviación típica de 2 g/dl.

 

Se obtuvo de una muestra de 12 extracciones y se calculó el intervalo de confianza para la media poblacional de la hemoglobina en la sangre. Si el intervalo obtenido fue entre 13 y 15 g/dl, ¿cuál es el nivel de confianza de este intervalo?

 

En este ejercicio ya conocemos el intervalo de confianza y lo que se nos pide calcular es el nivel de confianza, es decir, 1 - \alpha.

 

Notemos que tenemos que \sigma = 2, n = 12 y

 

\displaystyle \overline{X} = \frac{13 + 15}{2} = 14

 

es decir, la media es el punto medio del intervalo.

 

Como la muestra proviene de una población que sigue distribución normal, entonces el límite inferior del intervalo se calcula utilizando

 

\displaystyle 13 = \overline{X} - t_{\alpha/2} \frac{\sigma}{\sqrt{n}} = 14 - t_{\alpha/2} \frac{2}{\sqrt{12}}

 

ya que el tamaño de muestra n < 30. Además, t_{\alpha/2} es el valor crítico de una distribución t-Student con 11 grados de libertad. Así, despejando t_{\alpha/2} obtenemos

 

\displaystyle t_{\alpha/2} \frac{2}{\sqrt{12}} = 1 \quad \Longrightarrow \quad t_{\alpha/2} = 1.7321

 

Por tanto, tenemos que \alpha/2 se calcula utilizando

 

\displaystyle \alpha/2 = P(T > 1.73) = 1 - P(T < 1.73) = 0.05577

 

Así, \alpha = 0.1115 y 1 - \alpha = 0.8885. Es decir, el intervalo tiene una confiabilidad del 88.85%.

 

Pruebas de hipótesis con intervalos de confianza

 

9 Una marca de nueces afirma que, como máximo, el 6% de las nueces están vacías. Se eligieron 300 nueces al azar y se detectaron 21 vacías.

 

a Con un nivel de significación del 1%, ¿se puede aceptar la afirmación de la marca?

 

b Si se mantiene el porcentaje muestral de nueces que están vacías y 1 - \alpha = 0.95, ¿qué tamaño muestral se necesitaría para estimar la proporción de nueces con un error menor del 1%?

 

a El primer inciso involucra una prueba de hipótesis donde deseamos verificar que cierta proporción es menor a un valor dador. Así, la hipótesis nula es

 

\displaystyle H_0 : p \leq 0.06

 

mientras que la hipótesis alternativa es

 

\displaystyle H_A : p > 0.06

 

donde p_0 = 0.06 es la proporción hipotética.

 

El límite superior del intervalo de confianza para la proporción se calcula utilizando

 

\displaystyle p_0 + Z_{\alpha} \sqrt{\frac{p_0 (1 - p_0)}{n}}

 

ya que se trata de un contraste unilateral. Para este caso, tenemos que x = 21, n = 300 y p_0 = 0.06. Para nuestra significancia de \alpha = 0.01, el valor crítico que le corresponde es Z_{\alpha} = 2.3263. Así, el intervalo de confianza es

 

\displaystyle [0, 0.09190)

 

Dado que \hat{p} = 21/300 = 0.07 sí está dentro del intervalo de confianza, entonces aceptamos la hipótesis nula.

 

En consecuencia, concluimos que, el 6% de las nueces están vacías como máximo. Es decir, no tenemos evidencia suficiente para garantizar lo contrario.

 

b El porcentaje muestral de nueces vacías es del 7%. Por tanto, la proporción es \hat{p} = 0.07. Sabemos que el error de estimación es

 

\displaystyle E = Z_{\alpha/2} \sqrt{\frac{\hat{p}(1 - \hat{p})}{n}}

 

que en este caso deseamos que sea menor a 0.01. Además, para \alpha = 0.05 el valor crítico asociado es Z_{\alpha/2} = 1.96.

 

De este modo, tenemos que,

 

\displaystyle 0.01 > 1.96 \sqrt{\frac{0.07(0.93)}{n}}

 

que al despejar \sqrt{n}, obtenemos

 

\displaystyle \sqrt{n} > 1.96 \frac{\sqrt{0.07(0.93)}}{0.01} = 50.0088

 

Así, tenemos que

 

\displaystyle n > (50.0088)^2 = 2500.88

 

De este modo, el tamaño de población debe ser mayor o igual a 2501.

 

10 La duración de la bombillas de 100 W que fabrica una empresa sigue una distribución normal con una desviación típica de 120 horas de duración. Su vida media está garantizada durante un mínimo de 800 horas. Se escoge al azar una muestra de 50 bombillas de un lote y, después de comprobarlas, se obtiene una vida media de 750 horas. Con un nivel de significación de 0,01, ¿habría que rechazar el lote por no cumplir la garantía?

 

Este problema trata de una prueba de hipótesis donde deseamos verificar si la vida media es, por lo menos, un valor dado (800 horas). Por tanto, se trata de un contraste unilateral y la hipótesis nula es

 

\displaystyle H_0 : \mu \geq 800

 

y la hipótesis alternativa es

 

\displaystyle H_A : \mu < 800

 

donde la media hipotética es \mu_0 = 800.

 

Al tratarse de una hipótesis sobre la media, entonces el intervalo de confianza unilateral es

 

\displaystyle \mu_0 - Z_{\alpha} \frac{S}{\sqrt{n}}

 

y en este caso tenemos que \overline{X} = 750, n = 50, \mu_0 = 800 y S = 120. Además, a la significancia de \alpha = 0.01 le corresponde un valor crítico de Z_{\alpha} = 2.3263. Luego, el intervalo de confianza es

 

\displaystyle (760.5206, \infty)

 

es decir, \overline{X} = 750 no está dentro del intervalo de confianza, por lo que podemos rechazar la hipótesis nula.

 

Esto es, se concluye que tenemos evidencia suficiente para rechazar la hipótesis nula. Por lo tanto, la vida media es menor a 800 horas y podemos rechazar el lote ya que no se cumple la garantía.

 

11 Se sabe que la desviación típica de las notas de cierto examen de Matemáticas es 2,4. Para una muestra de 36 estudiantes se obtuvo una nota media de 5,6. ¿Sirven estos datos para confirmar la hipótesis de que la nota media del examen fue de 6, con un nivel de confianza del 95%?

 

Notemos que se trata de una prueba de hipótesis para el valor promedio en la calificación del examen. Es decir, la hipótesis nula es

 

\displaystyle H_0 : \mu = 6

 

mientras que la hipótesis alternativa es

 

\displaystyle H_A : \mu \neq 6

 

donde \mu_0 = 6. Como queremos probar que el promedio es igual a cierto valor, entonces utilizaremos un contraste bilateral.

 

Si asumimos que las notas siguen aproximadamente una distribución normal, entonces el intervalo de confianza para \mu es

 

\displaystyle \mu_0 \pm Z_{\alpha/2} \frac{S}{\sqrt{n}}

 

Además, en este caso tenemos que \overline{X} = 5.6, S = 2.4 y n = 36. Como el nivel de confianza es 95% y el contraste es bilateral, entonces Z_{\alpha/2} = 1.96. Sin embargo, tenemos que el intervalo de confianza es

 

\displaystyle (5.216, 6.784)

 

Por tanto, aceptamos la hipótesis nula ya que \overline{X} = 5.6 está dentro del intervalo de confianza. Es decir, aceptamos que la nota media es de 6.

 

Recordemos que esto sólo significa que no tenemos evidencia suficiente para decir que la nota sea diferente a 6.

 

¿Necesitas un/a profe de Matemáticas?

¿Te ha gustado el artículo?

¿Ninguna información? ¿En serio?Ok, intentaremos hacerlo mejor la próxima vezAprobado por los pelos. ¿Puedes hacerlo mejor?Gracias. Haznos cualquier pregunta en los comentar¡Un placer poder ayudarte! :) 3,63/5 - 8 voto(s)
Cargando…

Marta

➗ Licenciada en Químicas da clase de Matemáticas, Física y Química -> Comparto aquí mi pasión por las matemáticas ➗