Concepto de Intervalo de Confianza.
En el contexto de estimar un parámetro poblacional, un intervalo de confianza es un rango de valores (calculado en una muestra) en el cual se encuentra el verdadero valor del parámetro, con una probabilidad determinada.
La probabilidad de que el verdadero valor del parámetro se encuentre en el intervalo construido se denomina nivel de confianza, y se denota 1-
. La probabilidad de equivocarnos se llama nivel de significancia y se simboliza
. Generalmente se construyen intervalos con confianza 1-
=95% (o significancia
=5%). Menos frecuentes son los intervalos con
=10% o
=1%.
Para construir un intervalo de confianza, se puede comprobar que la distribución Normal Estándar cumple 1:
P(-1.96 < z < 1.96) = 0.95
(lo anterior se puede comprobar con una tabla de probabilidades o un programa computacional que calcule probabilidades normales).
Luego, si una variable X tiene distribución N(
Despejando
en la ecuación se tiene:
El resultado es un intervalo que incluye al
el 95% de las veces. Es decir, es un intervalo de confianza al 95% para la media
cuando la variable X es normal y 
es conocido.
Intervalos de confianza
El nivel de confianza y la amplitud del intervalo varían conjuntamente, de forma que un intervalo más amplio tendrá más posibilidades de acierto (mayor nivel de confianza), mientras que para un intervalo más pequeño, que ofrece una estimación más precisa, aumentan sus posibilidades de error.
Para la construcción de un determinado intervalo de confianza es necesario conocer la distribución teórica que sigue el parámetro a estimar, θ. Es habitual que el parámetro presente una distribución normal. También pueden construirse intervalos de confianza con la desigualdad de Chebyshov.
En definitiva, un intervalo de confianza al 1 - α por ciento para la estimación de un parámetro poblacional θ que sigue una determinada distribución de probabilidad, es una expresión del tipo [θ1, θ2] tal que P[θ1 ≤ θ ≤ θ2] = 1 - α, donde P es la función de distribución de probabilidad de θ.
Intervalo de confianza para la media de una población
De una población de media
Pero además, si el tamaño de las muestras es lo suficientemente grande,[3] la distribución de medias muestrales es, prácticamente, una distribución normal (o gaussiana) con media μ y una desviación típica dada por la siguiente expresión:
En una distribución Z ~ N(0, 1) puede calcularse fácilmente un intervalo dentro del cual caigan un determinado porcentaje de las observaciones, esto es, es sencillo hallar z1 y z2 tales que P[z1 ≤ z ≤ z2] = 1 - α, donde (1 - α)·100 es el porcentaje deseado (véase el uso de las tablas en una distribución normal).
Se desea obtener una expresión tal que
En esta distribución normal de medias se puede calcular el intervalo de confianza donde se encontrará la media poblacional si sólo se conoce una media muestral (
Para ello se necesita calcular el punto
Dicho punto es el número tal que:
Y en la versión estandarizada se cumple que:
Así:
Haciendo operaciones es posible despejar
De lo cual se obtendrá el intervalo de confianza:
Obsérvese que el intervalo de confianza viene dado por la media muestral
Si no se conoce
INTERVALO DE CONFIANZA PARA LA DIFERENCIA DE MEDIAS DE DOS DISTRIBUCIONES NORMALES, VARIANZAS DESCONOCIDAS
En esta sección se verá el caso en donde se tienen dos poblaciones con medias y varianzas desconocidas, y se desea encontrar un intervalo de confianza para la diferencia de dos medias 1- 2. Si los tamaños de muestras n1 y n2 son mayores que 30, entonces, puede emplearse el intervalo de confianza de la distribución normal. Sin embargo, cuando se toman muestras pequeñas se supone que las poblaciones de interés están distribuidas de manera normal, y los intervalos de confianza se basan en la distribución t.
Si s12 y s22 son las medias y las varianzas de dos muestras aleatorias de tamaño n1 y n2, respectivamente, tomadas de dos poblaciones normales e independientes con varianzas desconocidas pero iguales, entonces un intervalo de confianza del 100( ) por ciento para la diferencia entre medias es:
en donde:
es el estimador combinado de la desviación estándar común de la población con n1+n2 – 2 grados de libertad.
Ejemplos:
- Un artículo publicado dio a conocer los resultados de un análisis del peso de calcio en cemento estándar y en cemento contaminado con plomo. Los niveles bajos de calcio indican que el mecanismo de hidratación del cemento queda bloqueado y esto permite que el agua ataque varias partes de una estructura de cemento. Al tomar diez muestras de cemento estándar, se encontró que el peso promedio de calcio es de 90 con una desviación estándar de 5; los resultados obtenidos con 15 muestras de cemento contaminado con plomo fueron de 87 en promedio con una desviación estándar de 4. Supóngase que el porcentaje de peso de calcio está distribuido de manera normal. Encuéntrese un intervalo de confianza del 95% para la diferencia entre medias de los dos tipos de cementos. Por otra parte, supóngase que las dos poblaciones normales tienen la misma desviación estándar.
Solución:
El estimador combinado de la desviación estándar es:
Al calcularle raíz cuadrada a este valor nos queda que sp = 4.41
expresión que se reduce a – 0.72 1- 2 6.72
Nótese que el intervalo de confianza del 95% incluye al cero; por consiguiente, para este nivel confianza, no puede concluirse la existencia de una diferencia entre las medias.
- Se realizó un experimento para comparar el tiempo promedio requerido por el cuerpo humano para absorber dos medicamentos, A y B. Suponga que el tiempo necesario para que cada medicamento alcance un nivel específico en el torrente sanguíneo se distribuye normalmente. Se eligieron al azar a doce personas para ensayar cada fármaco registrándose el tiempo en minutos que tardó en alcanzar un nivel específico en la sangre. Calcule un intervalo de confianza del 95% para la diferencia del tiempo promedio. Suponga varianzas iguales.
Medicamento A
|
Medicamento B
|
nA = 12
|
nB = 12
|
SA2= 15.57
|
SB2 = 17.54
|
Solución:
2.35 B- A 9.25
Con un nivel confianza del 95% se sabe que el tiempo promedio para alcanzar un nivel específico es mayor para el medicamento B.
s = 1.1672
n = 4
Ensayo de hipótesis:
Estadístico de prueba:
Entonces los grados de libertad uno será el tamaño de la muestra de la población uno menos uno. 1= 5-1 = 4 y 2 = 4-1=3.
Regla de decisión:
Si 0.10 Fc 15.1 No se rechaza Ho,
Si la Fc < 0.10 ó si Fc > 15.1 se rechaza Ho.
Cálculo:
Decisión y Justificación:
Como 2.85 esta entre los dos valores de Ho no se rechaza , y se concluye con un = 0.05 que existe suficiente evidencia para decir que las varianza de las poblaciones son iguales.
Con la decisión anterior se procede a comparar las medias:
Ensayo de Hipótesis
Ho; CT- ST=0
H1; CT- ST >0
Los grados de libertad son (5+4-2) = 7
Regla de decisión:
Si tR 1.895 No se Rechaza Ho
Si tR > 1.895 se rechaza Ho
Cálculos:
por lo tanto sp = 1.848
Justificación y decisión:
Como 0.6332 es menor que 1.895, no se rechaza Ho, y se concluye con un nivel de significancia del 0.05 que no existe suficiente evidencia para decir que el suero detiene la leucemia.
- Se realizó un experimento para comparar el tiempo promedio requerido por el cuerpo humano para absorber dos medicamentos, A y B. Suponga que el tiempo necesario para que cada medicamento alcance un nivel específico en el torrente sanguíneo se distribuye normalmente. Se eligieron al azar a doce personas para ensayar cada fármaco registrándose el tiempo en minutos que tardó en alcanzar un nivel específico en la sangre. Calcule con
= 0.05 si existe diferencia entre los tiempos promedio y obtenga el valor de P. Suponga varianzas iguales.
Medicamento A
|
Medicamento B
|
nA = 12
|
nB = 12
|
SA2= 15.57
|
SB2 = 17.54
|
Solución:
Primero se pondrá a prueba el supuesto de varianzas iguales mediante una prueba de hipótesis con = 0.10.
Ensayo de hipótesis:
Estadístico de prueba:
Entonces los grados de libertad uno será el tamaño de la muestra de la población uno menos uno. 1=12-1=11 y 2=12-1=11.
No hay comentarios:
Publicar un comentario