16 febrero 2021
Temas
La inferencia estadística estudia los métodos para sacar conclusiones generales de toda una población a partir del análisis de una muestra. Además, estudia el grado de fiabilidad o confianza de los resultados obtenidos. Aquí te damos un resumen de los métodos más comunes que se utilizan en la inferencia estadística.
Tipos de muestreo
El muestreo consiste en tomar un subconjunto de una población. La muestra se suele denotar como y la población como
. Se distinguen los siguientes tipos de muestreo:
Muestreo aleatorio simple
En el muestreo aleatorio se enumeran todos los elementos de la población. Luego, se eligen al azar individuos de la población.
1 Si después de escoger al individuo , este ya no puede volver escogerse, entonces el muestreo se conoce como sin repetición.
2 Por el otro lado, si el individuo puede ser elegido más de una vez, entonces el muestreo se conoce como con repetición.
Muestreo aleatorio sistemático
En el muestreo sistemático se elige un punto inicial aleatorio . A partir de él se toman los demás elementos en intervalos constantes hasta completar la muestra. Es decir,
donde
es aleatorio.
Muestreo aleatorio estratificado
En el muestreo aleatorio estratificado la población se divide naturalmente en distintas clases o estratos (que deben ser mutuamente excluyentes); luego para cada uno de los estratos se hace un muestreo aleatorio simple.
Si el tamaño de cada sub-población es proporcional al tamaño del estrato respecto a la población, entonces se dice que tenemos muestreo estratificado con asignación proporcional.
Muestreo aleatorio por conglomerados
Aquí, la población también se divide en clases (aunque no necesariamente son excluyentes). Para realizar el muestreo por conglomerados, tomamos un muestra de clases en lugar de individuos.
Por ejemplo, en lugar de considerar todos los alumnos de una universidad, tomamos una muestra de los salones: así, entrevistamos a todos los alumnos de estos salones y el muestreo se simplifica.
Distribución de las medias muestrales
El teorema central del límite nos da información sobre la distribución de la media de una muestra. Es muy importante para la inferencia estadística.
Teorema central del límite
Teorema central del límite. Sea una población con media
y desviación estándar
. Si tomamos muestra de tamaño
, entonces las medidas
de estas muestras siguen aproximadamente una distribución normal con media
y desviación estándar
. Esto es,
La condición de que no es necesaria cuando la población original
sigue una distribución normal.
Consecuencias del teorema central del límite
Las siguientes son unas consecuencias importantes del teorema central del límite:
1 Nos permite determinar la probabilidad de que la media de una muestre concreta se encuentre en un intervalo determinado.
2 Permite calcular la probabilidad de que la suma de los elementos de una muestra esté, en principio, en un intervalo dado. Esto debido a que
3 Nos ayuda a inferir la media de la población a partir de una muestra.
Estimación de parámetros muestrales
Existen dos maneras para estimar un parámetro o propiedad de una población: estimación puntual y estimación por intervalo.
Estimación puntual
La estimación puntual se hace mediante el cálculo de un sólo número, el cual es la estimación del parámetro. Así, dada una muestra , se calcula un número
el cual se considera como el valor del parámetro poblacional.
Se tienen las siguientes estimaciones puntuales:
1 La media de una población con distribución normal se estima con el promedio
2 La desviación estándar de una población con distribución normal se estima con la desviación muestral
3 La proporción de una población con distribución binomial se hace con la la proporción muestral
donde es el número de elementos en
que cumplen con la propiedad deseada.
Intervalos de confianza
Un intervalo de confianza es un intervalo en donde sabemos que se encuentra el parámetro con un nivel de confianza específico.
El nivel de confianza se refiere a la probabilidad de que el parámetro a estimar se encuentre en nuestro intervalo de confianza. Se suele denotar con .
El error de estimación admisible se refiere a la probabilidad que se permite de cometer error. Esta se denota con .
El valor crítico de la distribución normal se escribe como . El valor crítico satisface que
por lo que también se cumple que
Intervalos característicos
Para la distribución normal , los intervalos de confianza tienen la forma
Estos intervalos se conocen también como intervalos característicos.
En la siguiente tabla se encuentran los intervalos característicos para los valores de significación más comunes:
Intervalos característicos | |||
---|---|---|---|
0.90 | 0.05 | 1.645 | |
0.95 | 0.025 | 1.96 | |
0.99 | 0.005 | 2.575 |
Estimación de la media con intervalo de confianza
Para estimar la media de una población a partir de la muestra
, se utiliza el siguiente intervalo de confianza
donde es el promedio de
,
es la desviación estándar de
y
es el tamaño de
. Además,
es el nivel de confianza deseado.
En este caso, el error máximo de estimación es
Además, el tamaño de muestra necesario para tener una precisión deseada se calcula mediante
Notemos que para calcular el tamaño de muestra necesario necesitamos conocer la desviación estándar de la población. Esta se puede estimar con una muestra pequeña y luego realizar una segunda muestra con el tamaño de muestra necesario.
Estimación de la proporción con intervalo de confianza
Supongamos que tenemos una población donde una proporción
de esta población satisface una característica determinada. Entonces, la proporción de individuos
que satisface esta propiedad en las muestra de tamaño
sigue aproximadamente una distribución normal:
De aquí, se sigue que la estimación de la proporción a partir de la proporción
de una muestra se hace mediante el siguiente intervalo:
Aquí, el error máximo de estimación está dado por
Hipótesis estadísticas y tipos de contraste
Una prueba estadística (o test estadístico) es un procedimiento para concluir la validez de una hipótesis sobre algún parámetro la población a partir de una muestra.
La hipótesis que se tiene de la población se denota como y se llama hipótesis nula. La hipótesis nula siempre debe ser de la forma "es igual a", "es menor o igual" o "es mayor o igual".
La hipótesis contraria a la que se tiene se la población se denota mediante y se llama hipótesis alternativa. Esta hipótesis es de la forma "es diferente a", "es mayor a" o "es menor a".
Pasos para realizar una prueba de hipótesis
En general, el procedimiento para realizar una prueba de hipótesis (para la media o la proporción
) es el siguiente:
1 Se hacen enuncian la hipótesis nula y la hipótesis alternativa
.
2 Determinar el nivel de confianza o de significación
.
3 Con esto se calcula el valor (para contraste bilateral) o
(para contraste unilateral).
4 Luego, se construye la zona de aceptación del parámetro muestral (mayor detalle en la siguiente sección).
5 Se extrae una muestra de la población con para poder utilizar la distribución normal.
6 Se calcula o
a partir de la muestra.
7 Si el valor del parámetro muestral está dentro de la zona de aceptación, entonces se acepta la hipótesis nula con un nivel de significación . En caso contrario, se rechaza
.
Tipos de contrastes de hipótesis
Supongamos que tenemos una población con un parámetro
desconocido (que puede ser la media, proporción o desviación estándar). Entonces los contrastes se clasifican como bilateral o unilateral. Estos contrastes se resumen en la siguiente tabla:
Bilateral | ||
---|---|---|
Unilateral | ||
Contraste bilateral
El contraste bilateral se da cuando la hipótesis nula es de la forma . En este caso, la hipótesis alternativa tiene la forma
.
Para los contrastes bilaterales, el nivel de significación se concentra en dos colas respecto a la media. Si
es el valor del parámetro en la muestra, esto significa que la hipótesis nula se rechaza si
es muy grande (cola superior) o muy pequeño (cola inferior) en comparación con
.
Para el caso en el que deseamos probar la media de la población, el intervalo de confianza se construye de la siguiente manera:
mientras que para el caso de la proporción , el intervalo de confianza es
Contraste unilateral
En el contraste unilateral tenemos dos casos. El primer caso es cuando la hipótesis nula es del tipo
por lo que la hipótesis alternativa es del tipo
En este caso, la región de aceptación cuando estamos haciendo una prueba para la media es
mientras que la región de aceptación para la proporción es
El segundo caso es cuando la hipótesis nula es del tipo
por lo que la hipótesis alternativa es del tipo
recordemos que puede ser
o
.
Así, la región de aceptación cuando estamos haciendo una prueba para la media es
mientras que la región de aceptación para la proporción es
Por último, notemos que en las hipótesis unilaterales tenemos los siguientes valores críticos más comunes:
0.90 | 0.10 | 1.28 |
0.95 | 0.05 | 1.645 |
0.99 | 0.01 | 2.33 |
Tipos de error
Cuando realizamos pruebas de hipótesis, siempre existe la posibilidad de cometer errores. Los errores se clasifican como error de tipo I y error de tipo II.
El error de tipo I ocurre cuando rechazamos la hipótesis nula siendo verdadera.
El error de tipo II, en cambio, sucede cuando aceptamos la hipótesis nula y esta es verdadera.
Los tipos de error se resumen en la siguiente tabla:
Verdadera | Falsa | |
---|---|---|
Aceptar | Decisión correcta Probabilidad de | Decisión incorrecta: Error tipo II |
Rechazar | Decisión incorrecta Error tipo I Probabilidad de | Decisión correcta |
La probabilidad de cometer el error de tipo I se el nivel de significación .
Por otro lado, la probabilidad de cometer el error de tipo II se suele denotar con . En este caso,
se conoce como potencia de la prueba. La mejor manera de reducir
es aumentando el tamaño de muestra
tanto como sea posible.
Apuntes es una plataforma dirigida al estudio y la práctica de las matemáticas a través de la teoría y ejercicios interactivos que ponemos a vuestra disposición. Esta información está disponible para todo aquel/aquella que quiera profundizar en el aprendizaje de esta ciencia. Será un placer ayudaros en caso de que tengáis dudas frente algún problema, sin embargo, no realizamos un ejercicio que nos presentéis de 0 sin que hayáis si quiera intentado resolverlo. Ánimo, todo esfuerzo tiene su recompensa.
Es interesante y sencilla la explicación pero no explica adecuadamente como desarrollar las formulas.
SEGÚN EL DUEÑO DE UN TALLER, SUS EMPLEADOS ESTÁN REPARANDO MÁXIMO 17 MOTOS EN PROMEDIO SEMANALMENTE. PARA PROBARLO, SELECCIONÓ ALEATORIAMENTE 33 MECÁMICO
Y OBTUVO EL NÚMERO DE REPARACIONES HECHAS POR CADA UNO DURANTE UNA SEMANA ALEATORIA. LOS RESULTADOS ARROJARON UNA MEDIA DE 19. DE UN ESTUDIO PREVIO, SE SABE QUE LA VARIANZA SEMANAL EN LA CANTIDAD DE MOTOS REPARADAS ES DE 10 (MOTOS AL CUADRADO).
CON BASE EN LA EVIDENCIA ESTADÍSTICA Y AL 1% DE SIGNIFICANCIA, CONCLUYA RESPECTO A LA AFIRMACIÓN DE ESTE DUEÑO.