¿Qué es la estimación puntual?

 

Una estimación puntual es un número que calculamos a partir de una muestra. Este número se conoce como estadística o estadístico. Así, utilizamos esta estadística para hacer la estimación del parámetro correspondiente de la población.

 

Ejemplo: Se realiza una encuesta a 500 jóvenes entre 8 y 25 años de la ciudad de Tarifa, en el sur de España. En la encuesta se indica que el 89% de los jóvenes practica Kitesurf. Como no se ha cuestionado a todos los jóvenes de la ciudad, entonces decimos que 89% es una estimación puntual del verdadero porcentaje de la problación.

 

Por tanto, podemos decir que alrededor del 89% de los jóvenes de la ciudad de Tarifa practican Kitesurf.

 

Ejemplo: Se mide el tiempo de vida de 40 bombillas de 60 W de cierto lote. Al calcular el promedio del tiempo de vida, se obtiene \overline{X} = 5.013 horas. Como no se midió el tiempo de vida para todas las 1.000 bombillas del lote, entonces 5.013 es una estimación puntual para el tiempo de vida media del lote.

 

La plataforma que conecta profes particulares y estudiantes
¡1a clase gratis!
Francisco javier
5
5 (24 opiniones)
Francisco javier
Matemáticas
10€
/h
¡1a clase gratis!
José arturo
4,9
4,9 (32 opiniones)
José arturo
Matemáticas
12€
/h
¡1a clase gratis!
José angel
4,9
4,9 (71 opiniones)
José angel
Matemáticas
5€
/h
¡1a clase gratis!
Fátima
5
5 (11 opiniones)
Fátima
Matemáticas
12€
/h
¡1a clase gratis!
Alex
5
5 (41 opiniones)
Alex
Matemáticas
12€
/h
¡1a clase gratis!
Santiago
5
5 (21 opiniones)
Santiago
Matemáticas
9€
/h
¡1a clase gratis!
Julio
5
5 (93 opiniones)
Julio
Matemáticas
14€
/h
¡1a clase gratis!
Amin
5
5 (50 opiniones)
Amin
Matemáticas
10€
/h
¡1a clase gratis!
Francisco javier
5
5 (24 opiniones)
Francisco javier
Matemáticas
10€
/h
¡1a clase gratis!
José arturo
4,9
4,9 (32 opiniones)
José arturo
Matemáticas
12€
/h
¡1a clase gratis!
José angel
4,9
4,9 (71 opiniones)
José angel
Matemáticas
5€
/h
¡1a clase gratis!
Fátima
5
5 (11 opiniones)
Fátima
Matemáticas
12€
/h
¡1a clase gratis!
Alex
5
5 (41 opiniones)
Alex
Matemáticas
12€
/h
¡1a clase gratis!
Santiago
5
5 (21 opiniones)
Santiago
Matemáticas
9€
/h
¡1a clase gratis!
Julio
5
5 (93 opiniones)
Julio
Matemáticas
14€
/h
¡1a clase gratis!
Amin
5
5 (50 opiniones)
Amin
Matemáticas
10€
/h
Ver todos los profes>

¿Qué es el error de muestreo?

 

La posibilidad de un error de muestreo existe siempre.

 

El error de muestreo es la diferencia entre una estadística que se calcula de una muestra, y el valor del parámetro correspondiente en la población. Como el error siempre es positivo, entonces se toma el valor absoluto de esta diferencia.

 

Es importante poder manejar este error de muestreo en el proceso de decisión. Al fin y al cabo, el objetivo de muchas de las herramientas estadísticas que aprendemos es apoyarnos al momento de una toma de decisiones.

 

Una característica del error de muestreo es que este es menor cuando el tamaño de muestra aumenta. Por este motivo se sugiere que el tamaño de muestra sea tan grande como se permita.

 

Por ejemplo, la estatura media de las mujeres de España es 163,4 cm, y supongamos que, al tomar una muestra de 1.000 mujeres, obtenemos una estatura promedio de 164,6. Entonces, el error de muestreo es

 

\displaystyle E = | 163,4 - 164,6 | = | -1,2 | = 1,2

 

Es decir, el error de muestreo fue de 1,2 cm.

 

¿Qué es el intervalo de confianza?

 

Por lo general, el error de muestreo no se puede eliminar. Por tanto, utilizamos un intervalo de confianza para poder manejar el error.

 

Definición de un intervalo de confianza

 

Definamos una probabilidad P. Deseamos construir un intervalo tal que el parámetro real de la población esté dentro del intervalo con una probabilidad P. Este intervalo se define con dos números L y U y se conoce como intervalo de confianza con nivel de confianza P. Se suele denotar al intervalo como (L, U)

 

El intervalo de confianza se construye a partir del estadístico muestral. Además, la probabilidad P se suele denotar como 1 - \alpha, en donde \alpha se conoce como el nivel de significación.

 

Ejemplo: Supongamos que, en el ejemplo de las bombillas de 60 W, el intervalo de confianza del 95% es (4.799, 5.227). Por tanto, sabemos que existe un 95% de probabilidad de que el tiempo de vida promedio de todo el lote esté entre las 4.799 y las 5.227 horas.

 

Variación del intervalo de confianza

 

Recordemos que la desviación estándar S es una medida de la variación de los datos en la población o muestra. Así, S será pequeña si todos los datos son muy similares entre sí; por otro lado, S será grande si los datos varían mucho entre sí.

 

La desviación estándar de una población/muestra finita se calcula mediante

 

\displaystyle S = \sqrt{\frac{\sum_{i = 1}^{n}{ (x_i - \overline{X})^2 }}{n - 1}}

 

en donde \overline{X} es el promedio de la muestra y n es el número de elementos en la muestra. La desviación estándar de la población se denota mediante \sigma, mientras que la desviación de la muestra se denota como S.

 

Notemos que si obtenemos una muestra X, entonces la estimación de la media sería \overline{X}. Sin embargo, si tomamos otra muestra diferente Y, la estimación será \overline{Y}. Es decir, las estimaciones puntuales también varían; por lo tanto, tiene sentido definir la desviación estándar para los estimadores.

 

En general, si conocemos la desviación estándar S de la población original, entonces la desviación estándar del promedio \overline{X} es

 

\displaystyle S_{\overline{X}} = \frac{S}{\sqrt{n}}

 

donde n es el tamaño de la muestra X. Para los estimadores puntuales, la desviación estándar se suele llamar error estándar.

 

A partir de la ecuación de arriba, podemos observar que si el tamaño de muestra n aumenta, entonces la desviación S_{\overline{X}} de la estimación disminuirá. En otras palabras, entre más grande sea la muestra, más cercanas serán las posibles estimaciones; de hecho, entre más grande sea la muestra, más cercana será la estimación al valor real del parámetro de la población.

 

Recordemos que S denota la desviación estándar de la población/muestra, mientras que S_{\overline{X}} denota el error estándar (o desviación estándar) de la estimación.

 

¿Cómo se calcula el intervalo de confianza?

 

Existen distintas formas de calcular los intervalos de confianza; cada una depende de la información que tengamos disponible.

 

Desviación estándar conocida y tamaño de muestra mayor a 30

 

Supongamos que tenemos una población X, cuyo tamaño de muestra es mayor o igual a 30, es decir, n \geq 30. Además, supongamos que sabemos que la desviación estándar de la población es S. Entonces, el intervalo de confianza para la media mu con un nivel de confianza de 1 - \alpha se calcula de la siguiente manera:

 

1 Calcula el promedio de la muestra,

 

\displaystyle \overline{X} = \frac{1}{n}\sum_{i = 1}^{n}{x_i}

 

2 Determina el error estándar de la estimación,

 

\displaystyle S_{\overline{X}} = \frac{\sigma}{\sqrt{n}}

 

3 Encuentra el valor crítico z_{\alpha/2} tal que P[Z > z_{\alpha/2}] = \alpha/2.

 

Si tenemos una variable Z con distribución estándar, entonces z_{\alpha/2} es aquél valor tal que la probabilidad de que Z sea mayor a z_{\alpha/2} es \alpha/2. No es sencillo encontrar estos valores de forma analítica, por tanto se utilizan tablas o software para encontrarlos.

 

La tabla de los valores de z_{\alpha/2} para las \alpha más comunes se encuentra más abajo.

 

4 Calcula el intervalo de confianza utilizando

 

    \begin{align*} L & = \overline{X} - z_{\alpha/2} \cdot S_{\overline{X}}\\U & = \overline{X} + z_{\alpha/2} \cdot S_{\overline{X}}\end{align*}

 

En algunos sitios se suele resumir el intervalo de confianza para este caso como

 

\displaystyle \overline{X} \pm z_{\alpha/2} \frac{\sigma}{\sqrt{n}}

 

Esta expresión indica tanto el límite inferior como el límite superior.

 

Ejemplo: Retomando el ejemplo de las bombillas de 60 W. Se tomó una muestra de 40 bombillas donde el tiempo de vida promedio fue \overline{X} = 5.013. Se tiene la información de que la desviación estándar del tiempo de vida es \sigma = 690 horas. Entonces, para calcular el intervalo de confianza al 95%, primero debemos notar que z_{\alpha/2} = 1.96. Así, tenemos que

 

    \begin{align*} z_{\alpha/2} \cdot \frac{\sigma}{\sqrt{n}} & = 1.96 \cdot \frac{690}{\sqrt{40}}\\& = 213,83\end{align*}

 

De este modo, el intervalo de confianza es

 

\displaystyle (5.013 - 213,83, 5.013 + 213,83) = (-4.798,17, 5.225,83)

 

Observemos que en el ejemplo anterior, calculamos primero la cantidad

 

\displaystyle E = z_{\alpha/2} \cdot \frac{\sigma}{\sqrt{n}}

 

Este valor se conoce como margen de error o error de estimación.

 

Dicho esto, hay una probabilidad de 1 - \alpha de que nuestra estimación \overline{X} tendrá un error de E como máximo. La importancia de los intervalos de confianza está en que nos permite estimar también la magnitud del error posible.

 

Desviación estándar desconocida

 

En el caso de que no conozcamos la desviación estándar de la población original, entonces debemos utilizar una estrategia ligeramente diferente para calcular el intervalo de confianza.

 

El procedimiento para calcular el intervalo de confianza es:

 

1 Calcula el promedio de la muestra,

 

\displaystyle \overline{X} = \frac{1}{n}\sum_{i = 1}^{n}{x_i}

 

2 Determina el error estándar de la muestra,

 

\displaystyle S = \sqrt{\frac{\sum_{i = 1}^{n}{ (x_i - \overline{X})^2 }}{n - 1}}

 

3 Encuentra el valor crítico t_{\alpha/2, n - 1} tal que P[T > t_{\alpha/2, n - 1}] = \alpha/2 donde T sigue una distribución t de Student con n - 1 grados de libertad.

 

En este caso tenemos una variable T con distribución t de Student con n - 1 grados de libertad. De este modo, t_{\alpha/2, n - 1} es aquél valor tal que la probabilidad de que T sea mayor a t_{\alpha/2, n - 1} es \alpha/2. De nuevo, no es sencillo encontrar estos valores de forma analítica, por tanto se utiliza software para encontrarlos.

 

4 Calcula el intervalo de confianza utilizando

 

    \begin{align*} L & = \overline{X} - t_{\alpha/2, n - 1} \cdot \frac{S}{\sqrt{n}}\\U & = \overline{X} + t_{\alpha/2, n - 1} \cdot \frac{S}{\sqrt{n}}\end{align*}

 

En este caso, el intervalo de confianza se resume como

 

\displaystyle \overline{X} \pm t_{\alpha/2, n - 1} \cdot \frac{S}{\sqrt{n}}

 

Ejemplo: Consideremos de nuevo el ejemplo de las bombillas de 60 W. Recordemos que se tomó una muestra de 40 bombillas donde el tiempo de vida promedio fue \overline{X} = 5.013.

 

Sin embargo, en este caso no sabemos la desviación estándar de la población. No obstante, al calcular la desviación estándar de las 40 bombillas, obtenemos que S = 681 horas. Entonces, para calcular el intervalo de confianza al 95%, primero debemos obtener t_{\alpha/2, n - 1} el cual es el valor crítico de una distribución T con 39 grados de libertad. Utilizando software, obtenemos que t_{\alpha/2, n - 1} = 2.023.

 

Así, tenemos que

 

    \begin{align*} t_{\alpha/2, n - 1} \cdot \frac{S}{\sqrt{n}} & = 2.023 \cdot \frac{681}{\sqrt{40}}\\& = 217,83\end{align*}

 

De este modo, el intervalo de confianza es

 

\displaystyle (5.013 - 217,83, 5.013 + 217,83) = (-4.795,17, 5.230,82)

 

Cuando la desviación estándar es desconocida, el margen de error se calcula utilizando

 

\displaystyle E = t_{\alpha/2, n - 1} \cdot \frac{S}{\sqrt{n}}

 

Tablas de valores críticos y uso de software estadístico

 

Como se puede apreciar, para determinar los intervalos de confianza se necesitan obtener los valores críticos; ya sea de una distribución normal o de una distribución t de Student.

 

En el caso de una distribución normal, los valores son muy conocidos y se resumen en la siguiente tabla, para valores de \alpha comunes:

 

1 - \alpha \alpha/2 z_{\alpha/2}
0.90 0.05 1.645
0.95 0.025 1.96
0.99 0.005 2.575

 

No obstante, estos valores se pueden conseguir utilizando software. De hecho, en el caso de la distribución t de Student, no es sencillo resumir los valores críticos en una tabla ya que estos valores son diferentes según los grados de libertad v.

 

En la siguiente lista se muestran algunas formas de obtener los valores críticos:

 

1 Para obtener el valor de z_{\alpha/2} con Excel, se utiliza la función

 

\displaystyle \mathtt{INV.NORM.ESTAND(1 - a/2)}

 

en donde \mathtt{a} es el valor de \alpha.

 

2 También se puede obtener el valor z_{\alpha/2} utilizando el software estadístico R. En este caso, la función a utilizar es \mathtt{qnorm(1 - a/2)}. De forma similar, \mathtt{a} debe tomar el valor que tiene \alpha.

 

3 Para el caso de la distribución t de Student, para obtener t_{\alpha/2, v} con Excel, se utiliza la función

 

\displaystyle \mathtt{INV.T(1- a/2, gl)}

 

en donde \mathtt{a} es el valor de \alpha y \mathtt{gl} son los grados de libertad v.

 

4 Por último, para obtener el valor t_{\alpha/2, v} utilizando R se utiliza la función \mathtt{qt(1 - a/2, gl)}. Al igual que en el caso anterior, \mathtt{a} toma el valor que tiene \alpha y \mathtt{gl} son los grados de libertad v.

 

Impacto del cambio de los parámetros en el intervalo de confianza

 

Algo que podemos notar es que, al realizar la estimación con intervalos de confianza, nosotros asignamos de forma arbitraria el tamaño de muestra n y el nivel de confianza 1 - \alpha.

 

Por lo regular, estos parámetros se asignan tomando en cuenta la precisión con la que deseamos la estimación. Por ejemplo, si deseamos una precisión muy precisa y confiable, entonces requerimos que 1 - \alpha sea grande y que el error E sea pequeño; en este caso requerimos que n también sea grande. Por otro lado, si por cuestiones de falta de recursos o tiempo no podemos tomar una muestra demasiado grande, entonces podemos ajustar 1 - \alpha para que sea más pequeña; en este caso, nuestra estimación será menos confiable.

 

A continuación discutimos el impacto de estos parámetros en los intervalos de confianza.

 

¿Qué pasa cuando cambiamos el nivel de confianza?

 

Observemos que el margen de error está dado por la expresión

 

\displaystyle E = t_{\alpha/2, n - 1} \cdot \frac{S}{\sqrt{n}}

 

Algo que debemos notar es que z_{\alpha/2} y t_{\alpha/2, n - 1} aumentan cuando el nivel de confianza 1 - \alpha aumenta. Por tanto, podemos reducir el nivel de confianza para reducir el tamaño de error; sin embargo, esto implica que hay menos confianza en el intervalo. En otras palabras, es más probable que tu estimación se encuentre fuera del intervalo de confianza.

 

¿Qué pasa cuando cambiamos el tamaño de muestra?

 

Por otro lado, de la misma ecuación del error

 

\displaystyle E = t_{\alpha/2, n - 1} \cdot \frac{S}{\sqrt{n}}

 

podemos observar que cuando n aumenta, el tamaño del error disminuye (conservando el mismo nivel de confianza). Por este motivo es que es ideal que el tamaño de muestra sea lo suficientemente grande para poder tener un margen de error pequeño y un alto nivel de confianza.

 

Tamaño de muestra necesario

 

Si despejamos n de E, obtenemos

 

\displaystyle n = \frac{t^2_{\alpha/2, n - 1} S^2}{E^2}

 

Así, si tenemos un error deseado E, podemos calcular el tamaño de muestra necesario para que nuestra estimación no supere ese error.

 

Para hacer eso, primero es necesario tomar una muestra pequeña (dependiendo el contexto, incluso 15 elementos son suficientes). Con esto, estimamos el tamaño de muestra n necesario para que nuestro error sea menor a E. Luego, volvemos a tomar una muestra pero ahora con un tamaño de muestra n.

 

¿Necesitas un/a profe de Matemáticas?

¿Te ha gustado el artículo?

¿Ninguna información? ¿En serio?Ok, intentaremos hacerlo mejor la próxima vezAprobado por los pelos. ¿Puedes hacerlo mejor?Gracias. Haznos cualquier pregunta en los comentar¡Un placer poder ayudarte! :) 3,50/5 - 16 voto(s)
Cargando...

Marta

➗ Licenciada en Químicas da clase de Matemáticas, Física y Química -> Comparto aquí mi pasión por las matemáticas ➗