martes, 27 de noviembre de 2018

mi curso mooc de estadistica inferencial 1


prueba de hipotesis de proporciones

Prueba de proporciones de una muestra

Cuando el objetivo del muestreo es evaluar la validez de una afirmación con respecto a la proporción de una población, es adecuado utilizar una prueba de una muestra. La metodología de prueba depende de si el número de observaciones de la muestra es grande o pequeño.
Como se habrá observado anteriormente, las pruebas de grandes muestras de medias y proporciones son bastante semejantes. De este modo, los valoresestadísticos de prueba miden la desviación de un valor estadístico de muestra a partir de un valor propuesto. Y ambas pruebas se basan en la distribución normal estándar para valores críticos. Quizá la única diferencia real entre las ambas radica en la forma corno se obtiene la desviación estándar de la distribución de muestreo.
Esta prueba comprende el cálculo del valor estadístico de prueba Z
Monografias.com
Posteriormente este valor es comparado con el valor de Z, obtenido a partir de una tabla normal a un nivel de significación seleccionado.
Como ocurrió con la prueba de medias de una muestra, las pruebas de proporciones pueden ser de una o dos colas.
Monografias.com
La primera alternativa establece una prueba de cola derecha, la segunda, izquierda y la tercera, una prueba de dos colas.
Ejemplo ilustrativo
En un estudio se afirma que 3 de 10 estudiantes universitarios trabajan. Pruebe esta aseveración, a un nivel de significación de 0,025, respecto a la alternativa de que la proporción real de los estudiantes universitarios trabajan es mayor de lo que se afirma, si una muestra aleatoria de 600 estudiantes universitarios revela que 200 de ellos trabajan. La muestra fue tomada de 10000 estudiantes.
Los datos son:
Monografias.com
Como en los datos aparece el tamaño de la población, se debe verificar si el tamaño de la nuestra es mayor que el 5%. Se remplaza valores en la siguiente fórmula:
Monografias.com
Los cálculos en Excel se muestran en la siguiente figura:
Monografias.com
El gráfico elaborado en Winstats y Paint se muestra a continuación:
Monografias.com
Decisión:
Monografias.com
Resultado de imagen para prueba de hipotesis de proporciones

prueba de hipotesis de la media

Prueba medias de una muestra

Se utiliza una prueba de una muestra para probar una afirmación con respecto a una media de una población única.
Monografias.com
Nota: Se considera práctico utilizar la distribución t solamente cuando se requiera que el tamaño de la muestra sea menor de 30, ya que para muestras más grandes los valores t y z son aproximadamente iguales, y es posible emplear la distribución normal en lugar de la distribución t.
Monografias.com
Ejemplos ilustrativos:
1) La duración media de una muestra de 300 focos producidos por una compañía resulta ser de 1620 horas.
Monografias.com
Como se tiene como dato el tamaño de la población se tiene que verificar si cumple con la condición para utilizar el factor finito de corrección.
Monografias.com
Los cálculos en Excel se muestran en la siguiente imagen:
Monografias.com
El gráfico elaborado con Winstats y Paint se muestra en la siguiente imagen:
Monografias.com
2) La duración media de lámparas producidas por una compañía han sido en el pasado de 1120 horas. Una muestra de 8 lámparas de la producciónactual dio una duración media de 1070 horas con una desviación típica de 125 horas.
Monografias.com
Los cálculos en Excel se muestran en la siguiente imagen:
Monografias.com
El gráfico elaborado con Winstats y Paint se muestra en la siguiente imagen:
Monografias.com
Resultado de imagen para prueba de hipotesis de la media

Prueba de Hipótesis sobre la varianza

Prueba de Hipótesis sobre la varianza

Estadístico:

ji-cuadrada



Ejemplo:
Un fabricante de detergente liquido esta interesado en la uniformidad de la maquina utilizada para llenar botellas de manera especifica es deseable que la varianza sea; 0.01 onzas² del liquido. Al tomar una muestra aleatoria de 20 botellas se obtiene una varianza muestral (s²) para el volumen de llenado de ese cuadrado s²=0.0153.(distribución normal)
El fabricante esta preocupado por que piensa que la variación del proceso es mayor que la variación histórica. Con un α=0.05, el fabricante tiene elementos que sustenten se preocupación?
1) H0: σ²≤0.01
H1: σ²≤0.01

2) Calcular valores críticos.


3)Decisión.


No hay evidencia estadística para no aceptar H0.

Conclusión: Existe evidencia que la varianza no es mayor al valor histórico por lo tanto, no es necesario hacer ajustes al proceso de llenado.



miércoles, 14 de noviembre de 2018

intervalo de confianza para la varianza de distrubucion normal

Intervalo de confianza para la varianza de una distribución Normal

Dada una variable aleatoria con distribución Normal N(μ; σ), el objetivo es la construcción de un intervalo de confianza para el parámetro σ, basado en una muestra de tamaño n de la variable. 
A partir del estadístico
la fórmula para el intervalo de confianza, con nivel de confianza 1  α es la siguiente
Donde χ2α/2 es el valor de una distribución ji-cuadrado con  1 grados de libertad que deja a su derecha una probabilidad de α/2.
Por ejemplo, dados los datos siguientes:
  • Distribución poblacional: Normal
  • Tamaño de muestra: 10
  • Confianza deseada para el intervalo: 95 %
  • Varianza muestral corregida: 38,5
Un intervalo de confianza al 95 % para la varianza de la distribución viene dado por:
que resulta, finalmente


jueves, 8 de noviembre de 2018

intervalo de confianza de proporciones

Dada una variable aleatoria con distribución Binomial B(np), el objetivo es la construcción de un intervalo de confianza para el parámetro p, basada en una observación de la variable que ha dado como valor x. El mismo caso se aplica si estudiamos una Binomial B(1, p) y consideramos el número de veces que ocurre el suceso que define la variable al repetir el experimento n veces en condiciones de independencia.
Existen dos alternativas a la hora de construir un intervalo de confianza para p:
  • Considerar la aproximación asintótica de la distribución Binomial en la distribución Normal.
  • Utilizar un método exacto.

Aproximación asintótica
Tiene la ventaja de la simplicidad en la expresión y en los cálculos, y es la más referenciada en la mayoría de textos de estadística. Se basa en la aproximación
que, trasladada a la frecuencia relativa, resulta
Tomando como estadístico pivote
 
que sigue una distribución N(0, 1), y añadiendo una corrección por continuidad al pasar de una variable discreta a una continua, se obtiene el intervalo de confianza asintótico:
donde zα/2 es el valor de una distribución Normal estándar que deja a su derecha una probabilidad de α/2 para un intervalo de confianza de  (1 − α) · 100 %Las condiciones generalmente aceptadas para considerar válida la aproximación asintótica anterior son:
El intervalo obtenido es un intervalo asintótico y por tanto condicionado a la validez de la aproximación utilizada. Una información más general sobre los intervalos de confianza asintóticos puede encontrase aquí.

Intervalo exacto
Aun cuando las condiciones anteriores no se verifiquen, es posible la construcción de un intervalo exacto, válido siempre pero algo más complicado en los cálculos. Es posible demostrar que un intervalo exacto para el parámetro p viene dado por los valores siguientes:
donde Fα/2,a,b es el valor de una distribución F de Fisher-Snedecor con a y b grados de libertad que deja a su derecha una probabilidad de α/2 para un intervalo de confianza de  (1 − α) · 100 %.
Una justificación de los intervalos de confianza exactos para distribuciones discretas puede encontrarse aquí.
En el programa siguiente se pueden calcular los intervalos de confianza asintótico y, si n es menor de 100, también el exacto para una proporción.



 

miércoles, 31 de octubre de 2018

intervalos de confianza para diferencia de medias

Los intervalos de confianza para la diferencia de medias, se aplica en situaciones como las siguientes;

  • Comparación entre las calificaciones promedio de cualquier examen, considerando a dos grupos.
  • Las producciones promedio en una planta química que usa materias primas  suministradas por dos proveedores diferentes.

  • El promedio de diámetros de tallos de plantas crecidas con dos tipos diferentes de
    nutrientes.

Definición

Intervalo de confianza para la diferencia de dos medias (muestras grandes)






Definición

Intervalo de confianza para la diferencia de medias (muestras pequeñas) con base en muestras aleatorias indepedientes.








Ejemplo

Considere los siguientes datos;
Datos 1  Datos 2
32          35
37          31
35          29
28          25
41          34
44          40
35          27
31          32
34          31

¿El promedio de los Datos 1 son significativamente diferentes al promedio de los Datos 2? para el 95%.


Solución


Este problema se resuelve con un intervalo de confianza para muestras pequeñas, ya que cada serie de datos no es mayor a 30. Por lo tanto tomamos la ecuación anterior.  

En R tenemos 

df=9+9-2=16

S2=((8)*var(Datos1)+(8)*var(Datos2))/(16)=22.23611


t_{0.025,16} (t student)  (el código en R; qnorm(0.025) para la normal)

qt(0.025,16)=-2.119905


(mean(Datos1)-mean(Datos2))+(qt(0.025,16)*sqrt(S2*((1/9)+(1/9))))

 (mean(Datos1)-mean(Datos2))-(qt(0.025,16)*sqrt(S2*((1/9)+(1/9))))


(-1.045706,  8.379039)

Como el intervalo de confianza incluye el cero, el promedio de los Datos 1 no son significativamente diferentes al promedio de los Datos 2, esto es; existe la posibilidad de que sean iguales. 




miércoles, 10 de octubre de 2018

estimadores puntuales

Estimaciones de punto y estimaciones de intervalo, su fiabilidad:

Una estimación de un parámetro de la población dada por un solo numero se llama una estimación de punto del parámetro. Una estimación de un parámetro de la población dada por dos puntos, entre los cuales se pueden considerar encajado al parámetro, se llama una estimación del intervalo del parámetro.
Las estimaciones de intervalo que indican la precisión de una estimación  y son por tanto preferibles a las estimaciones de punto
Ejemplo:
Si decimos que una distancia sé a medido como 5.28 metros (m), estamos dando una estimación de punto. Por otra parte, si decimos que la distancia es 5.28 ± 0.03 m, (ósea, que esta entre 5.25 y 5.31 m), estamos dando una estimación de intervalo
El margen de error o la percepción de una estimación nos informa su fiabilidad.

Estimaciones De Intervalos De Confianza Para Parámetros De Población:
Sean  y   la media y la desviación típica (error típico) de la distribución de muestreo de un estadístico S. Entonces, si la distribución de muestreo de s es aproximadamente normal (que como hemos visto es cierto para muchos estadísticos si el tamaño de la muestra es N³30), podemos esperar hallar un estadisco muestral  real  S que este en los intervalos  alrededor del 68.27 %, 95.45% y 99.7 % del tiempo restante, respectivamente.
La tabla 1. Corresponde a los niveles de confianza usados en la practica. Para niveles de confianza que no aparecen en la tabla, los valores Zc se pueden encontrar gracias a las tablas de áreas bajo la curva normal.

Nivel de confianza
99.7 %     99%     98%     96%     95.45%     95%     90%     80%     6827%     50%

Zc

3.00          2.58     2.33       2.05        2.00           1.96     1.645    1.28      1.00      0.6745

Intervalos de confianza para la media:
Si el estadístico s de la media de la muestra, entonces los limites de confianza respectivamente. Mas en general los limites de confianza para estimar la media  de la población m viene dado por usando los valores de
Si el muestreo de la población es infinita por lo tanto viene dado por:
Para ver el grafico seleccione la opción ¨Bajar trabajo¨ del menú superior
Si el muestro es sin reposición de una población de tamaño Np.
Ejemplo
Halar laos limites de confianza de 98% y 90%.para los diámetros de una bolsa
Solución:
Sea Z =Zc tal que al área bajo la curva normal a la derecha sea 1% . Entonces , por simetría el área del lado izquierdo de Z=-Zc . como el área total bajo la curva  es 1, Zc= 0.49 por lo tanto, Zc=2.33. luego el limite de confianza es 98% son X= ±2.33s¤ÖN=0.824± 2.33(0.042/ Ö200)=0.824 ±0.069 cm.
Generalmente, la desviación típica de la población no es conocida. Así pues , para obtener los limites usamos la estimación s o S es satisfactorio si N>=30, si a aproximación es pobre y debe de empleare la teoría de pequeñas muestras.

3.Cálculo del tamaño de la muestra
A la hora de determinar el tamaño que debe alcanzar una muestra hay que tomar en cuenta varios factores: el tipo de muestreo, el parámetro a estimar, el error muestral admisible, la varianza poblacional y el nivel de confianza. Por ello antes de presentar algunos casos sencillos de cálculo del tamaño muestral delimitemos estos factores.
Parámetro. Son las medidas o datos que se obtienen sobre la población.
Estadístico. Los datos o medidas que se obtienen sobre una muestra y por lo tanto una estimación de los parámetros.
Error Muestral, de estimación o standard. Es la diferencia entre un estadístico y su parámetro correspondiente. Es una medida de la variabilidad de las estimaciones de muestras repetidas en torno al valor de la población, nos da una noción clara de hasta dónde y con qué probabilidad una estimación basada en una muestra se aleja del valor que se hubiera obtenido por medio de un censo completo. Siempre se comete un error, pero la naturaleza de la investigación nos indicará hasta qué medida podemos cometerlo (los resultados se someten a error muestral e intervalos de confianza que varían muestra a muestra). Varía según se calcule al principio o al final. Un estadístico será más preciso en cuanto y tanto su error es más pequeño. Podríamos decir que es la desviación de la distribución muestral de un estadístico y su fiabilidad.
Nivel de Confianza. Probabilidad de que la estimación efectuada se ajuste a la realidad. Cualquier información que queremos recoger está distribuida según una ley de probabilidad (Gauss o Student), así llamamos nivel de confianza a la probabilidad de que el intervalo construido en torno a un estadístico capte el verdadero valor del parámetro.
Varianza Poblacional. Cuando una población es más homogénea la varianza es menor y el número de entrevistas necesarias para construir un modeloreducido del universo, o de la población, será más pequeño. Generalmente es un valor desconocido y hay que estimarlo a partir de datos de estudios previos.
Tamaño de muestra para estimar la media de la población
Veamos los pasos necesarios para determinar el tamaño de una muestra empleando el muestreo aleatorio simple. Para ello es necesario partir de dos supuestos: en primer lugar el nivel de confianza al que queremos trabajar; en segundo lugar, cual es el error máximo que estamos dispuestos a admitir en nuestra estimación. Así pues los pasos a seguir son:
Veamos los pasos necesarios para determinar el tamaño de una muestra empleando el muestreo aleatorio simple. Para ello es necesario partir de dos supuestos: en primer lugar el nivel de confianza al que queremos trabajar; en segundo lugar, cual es el error máximo que estamos dispuestos a admitir en nuestra estimación. Así pues los pasos a seguir son:
1.- Obtener el tamaño muestral imaginando que N->a

Para ver el grafico seleccione la opción ¨Bajar trabajo¨ del menú superior
Donde:
Para ver el grafico seleccione la opción ¨Bajar trabajo¨ del menú superior:
z correspondiente al nivel de confianza elegido
Para ver el grafico seleccione la opción ¨Bajar trabajo¨ del menú superior
: varianza poblacional
e: error máximo

2.- Comprobar si se cumple
Para ver el grafico seleccione la opción ¨Bajar trabajo¨ del menú superior
Si esta condición se cumple el proceso termina aquí, y ese es el tamaño adecuado que debemos muestrear.
Si no se cumple, pasamos a una tercera fase:
3.- Obtener el tamaño de la muestra según la siguie       n                      te fórmula:
Para ver el grafico seleccione la opción ¨Bajar trabajo¨ del menú superior 
Veamos un ejemplo: La Consejería de Trabajo planea un estudio con el interés de conocer el promedio de horas semanales trabajadas por las mujeres delservicio doméstico. La muestra será extraída de una población de 10000 mujeres que figuran en los registros de la Seguridad Social y de las cuales se conoce a través de un estudio piloto que su varianza es de 9.648. Trabajando con un nivel de confianza de 0.95 y estando dispuestos a admitir un error máximo de 0,1, ¿cuál debe ser el tamaño muestral que Empleemos?.
Buscamos en las tablas de la curva normal el valor de que corresponde con el nivel de confianza elegido: = ±1.96 y seguimos los pasos propuestos arriba.
Para ver el grafico seleccione la opción ¨Bajar trabajo¨ del menú superior
3.-
Para ver el grafico seleccione la opción ¨Bajar trabajo¨ del menú superior
Tamaño de muestra para estimar la proporción de la población
Para calcular el tamaño de muestra para la estimación de proporciones poblaciones hemos de tener en cuenta los mismos factores que en el caso de la media. La fórmula que nos permitirá determinar el tamaño muestral es la siguiente:
Para ver el grafico seleccione la opción ¨Bajar trabajo¨ del menú superior

: z correspondiente al nivel de confianza elegido
P: proporción de una categoría de la variable
e: error máximo
N: tamaño de la población

domingo, 7 de octubre de 2018

DISTRIBUCION DE VARIANZA JI-CUADRADA (X2)

DISTRIBUCION JI-CUADRADA (X2)

En realidad la distribución ji-cuadrada es la distribución muestral de s2. O sea que si se extraen todas las muestras posibles de una población normal y a cada muestra se le calcula su varianza, se obtendrá la distribución muestral de varianzas.

Para estimar la varianza poblacional o la desviación estándar, se necesita conocer el estadístico X2. Si se elige una muestra de tamaño n de una población normal con varianza , el estadístico:
tiene una distribución muestral que es una distribución ji-cuadrada con gl=n-1 grados de libertad y se denota X2 (X es la minúscula de la letra griega ji). El estadístico ji-cuadrada esta dado por:
donde n es el tamaño de la muestra, s2 la varianza muestral y  la varianza de la población de donde se extrajo la muestra. El estadístico ji-cuadrada también se puede dar con la siguiente expresión:
Propiedades de las distribuciones ji-cuadrada

  1. Los valores de X2 son mayores o iguales que 0.


  2. La forma de una distribución X2 depende del gl=n-1. En consecuencia, hay un número infinito de distribuciones X2.


  3. El área bajo una curva ji-cuadrada y sobre el eje horizontal es 1.


  4. Las distribuciones X2 no son simétricas. Tienen colas estrechas que se extienden a la derecha; esto es, están sesgadas a la derecha.


  5. Cuando n>2, la media de una distribución X2 es n-1 y la varianza es 2(n-1).


  6. El valor modal de una distribución X2 se da en el valor (n-3).
La siguiente figura ilustra tres distribuciones X2. Note que el valor modal aparece en el valor (n-3) = (gl-2).
La función de densidad de la distribución X2 esta dada por:
para x>0
La tabla que se utilizará para estos apuntes es la del libro de probabilidad y estadística de Walpole, la cual da valores críticos  (gl) para veinte valores especiales de . Para denotar el valor crítico de una distribución X2 con gl grados de libertad se usa el símbolo  (gl); este valor crítico determina a su derecha un área de  bajo la curva X2 y sobre el eje horizontal. Por ejemplo para encontrar X20.05(6) en la tabla se localiza 6 gl en el lado izquierdo y a o largo del lado superior de la misma tabla.
Cálculo de Probabilidad
El cálculo de probabilidad en una distribución muestral de varianzas nos sirve para saber como se va a comportar la varianza o desviación estándar en una muestra que proviene de una distribución normal.

Ejemplos:
  1. Suponga que los tiempos requeridos por un cierto autobús para alcanzar un de sus destinos en una ciudad grande forman una distribución normal con una desviación estándar =1 minuto. Si se elige al azar una muestra de 17 tiempos, encuentre la probabilidad de que la varianza muestral sea mayor que 2.


  2. Solución:Primero se encontrará el valor de ji-cuadrada correspondiente a s2=2 como sigue:
    El valor de 32 se busca adentro de la tabla en el renglón de 16 grados de libertad y se encuentra que a este valor le corresponde un área a la derecha de 0.01. En consecuencia, el valor de la probabilidad es P(s2>2)
  3. Encuentre la probabilidad de que una muestra aleatoria de 25 observaciones, de una población normal con varianza 
, tenga una varianza muestral:


  1. Mayor que 9.1


  2. Entre 3.462 y 10.745

Solución.

  1. Primero se procederá a calcular el valor de la ji-cuadrada:
Al buscar este número en el renglón de 24 grados de libertad nos da un área a la derecha de 0.05. Por lo que la P(s>9.1) = 0.05


  1. Se calcularán dos valores de ji-cuadrada:

Aquí se tienen que buscar los dos valores en el renglón de 24 grados de libertad. Al buscar el valor de 13.846 se encuentra un área a la derecha de 0.95. El valor de 42.98 da un área a la derecha de 0.01. Como se está pidiendo la probabilidad entre dos valores se resta el área de 0.95 menos 0.01 quedando 0.94.
Por lo tanto la P(3.462  s2  10.745) = 0.94
Estimación de la Varianza
Para poder estimar la varianza de una población normal se utilizará la distribución ji-cuadrada.
Al despejar esta fórmula la varianza poblacional nos queda:
Los valores de X2 dependerán de nivel de confianza que se quiera al cual le llamamos . Si nos ubicamos en la gráfica se tiene:
Ejemplos:

  1. Los siguientes son los pesos, en decagramos, de 10 paquetes de semillas de pasto distribuidas por cierta compañía: 46.4, 46.1, 45.8, 47.0, 46.1, 45.9, 45.8, 46.9, 45.2 y 46. Encuentre un intervalo de confianza de 95% para la varianza de todos los paquetes de semillas de pasto que distribuye esta compañía, suponga una población normal.


  2. Solución:Primero se calcula la desviación estándar de la muestra:

    al elevar este resultado al cuadrado se obtiene la varianza de la muestra s2= 0.286.
    Para obtener un intervalo de confianza de 95% se elige un = 0.05. Después con el uso de la tabla con 9 grados de libertad se obtienen los valores de X2.
    Se puede observar en la gráfica anterior que el valor de X2 corre en forma normal, esto es de izquierda a derecha.

    Por lo tanto, el intervalo de confianza de 95% para la varianza es:
    Graficamente:
    Se observa que la varianza corre en sentido contrario, pero esto es sólo en la gráfica. La interpretación quedaría similar a nuestros temas anteriores referentes a estimación. Con un nivel de confianza del 95% se sabe que la varianza de la población de los pesos de los paquetes de semillas de pasto esta entre 0.135 y 0.935 decagramos al cuadrado.



  3. En trabajo de laboratorio se desea llevar a cabo comprobaciones cuidadosas de la variabilidad de los resultados que producen muestras estándar. En un estudio de la cantidad de calcio en el agua potable, el cual se efectúa como parte del control de calidad, se analizó seis veces la misma muestra en el laboratorio en intervalos aleatorios. Los seis resultados en partes por millón fueron 9.54, 9.61, 9.32, 9.48, 9.70 y 9.26. Estimar la varianza de los resultados de la población para este estándar, usando un nivel de confianza del 90%.

Solución:
Al calcular la varianza de la muestra se obtiene un valor de s2= 0.0285.
Se busca en la tabla los valores correspondientes con 5 grados de libertad, obteniéndose dos resultados. Para X2(0.95,5)= 1.145 y para X2(0.0,5)= 11.07.
Entonces el intervalo de confianza esta dado por:

y
En la mayoría de los casos se tiene el problema de desconocer la varianza o desviación estándar de la población, en donde las distribuciones son normales. Si se desea probar una hipótesis acerca de la varianza se puede hacer utilizando las medidas estadísticas con las que se construyó el intervalo de confianza , esto es con la distribución Ji- cuadrada.

Ejemplos:
  1. Una compañía que produce una parte maquinada para un motor, afirma que tiene una varianza de diámetro no mayor a 0.0002 pulgadas. Una muestra aleatoria de 10 de dichas partes dio una varianza de muestra s2 = 0.0003. Si se supone que las medidas del diámetro se distribuyen en forma normal, ¿hay evidencia para refutar lo que afirma el proveedor? Use = 0.05.


  2. Solución:Como en todos los ensayos de hipótesis que se han realizado anteriormente el procedimiento es el mismo. Después de que se identifican los datos, se plantea la hipótesis para determinar el tipo de ensayo.

    Datos:
    = 0.0002
    n = 10
    s2 = 0.0003
    = 0.05

    Ensayo de hipótesis:
    Ho= 0.0002
    H1> 0.0002
    Regla de decisión:
    Si X2R 16.919 no se rechaza Ho.
    Si X2R>16.919 se rechaza Ho.

    Cálculos:
    Justificación y decisión:
    Como 13.5 no es mayor que 16.919 por lo tanto no se rechaza Ho y se concluye con un nivel de significancia de 0.05 que no se puede refutar la afirmación del proveedor.

    Este ejercicio se puede aprovechar para calcular el valor de P. En la tabla se busca el valor de 13.5 en el renglón de 9 grados de libertad. Interpolando entre 0.10 y 0.20 se obtiene un valor de P de 0.1484.
  3. El contenido de azúcar del almíbar de los duraznos enlatados tiene una distribución normal, donde se cree que la varianza es  = 18 mg2. Se toma una muestra de 10 latas dieron una desviación estándar de 4.8 mg. ¿Muestran estos datos suficiente evidencia para decir que la varianza ha cambiado?. Use un  = 0.05 y calcule el valor de P.

  4. Solución:Datos:
    = 18
    n = 10
    s = 4.8
    = 0.05

    Ensayo de hipótesis:

    Ho= 18
    H1 18
    Regla de decisión:
    Si 2.7 X2R 19.023 no se rechaza Ho.
    Si X2R<2.7 ó si X2R>19.023 se rechaza Ho.

    Cálculos:
    Justificación y decisión:
    Como 11.52 está entre 2.7 y 19.023, no se rechaza Ho, y se concluye con un nivel de significancia de 0.05 que la varianza del contenido de azúcar del almíbar no ha cambiado, esto es es de 18 mg2.
    Si recordamos al principio de este tema se dijo que la media de la distribución ji-cuadrada es (n-1), por lo tanto la media de este ejercicio es de 9. Como el valor real de X2R = 11.52 este número se encuentra a la derecha de la media, lo cual quiere decir que el valor de P/2 será el área a la derecha del valor de X2R. Al buscar el valor de 11.52 en la tabla se obtiene un área de 0.2423, por lo tanto P/2 = 0.2423 y P= (2)(0.2423) = 0.4846

  5. Experiencia anterior indica que el tiempo que se requiere para que los estudiantes de último año de preparatoria completen una prueba estandarizada es una variable aletoria normal con una desviación estándar de seis minutos. Se toma una muestra aleatoria de 20 estudiantes de último año de preparatoria y se obtiene una desviación estándar de 4.51. ¿Muestran estos datos suficiente evidencia para decir que la desviación estándar disminuyó?. Utilice el valor de P para su decisión.

Solución:

Datos:
= 6
n = 20
s = 4.51

Ensayo de hipótesis:
Ho = 6
H1 < 6

Cálculos:
Para obtener el valor de P, se busca en la tabla el 10.735 con 19 grados de libertad, y el área que se encuentra es la que está a la derecha de este valor. Como la media de esta distribución ji-cuadrada es de 19, por lo tanto el valor de 10.735 queda a la izquierda de la media. El valor de P es de 0.07, y con esto se puede concluir que si hubiéramos utilizado un nivel de significancia de 0.10, se rechaza Ho y se concluye que la desviación estándar disminuyo, pero si se utiliza un valor de  = 0.05, entonces no se rechaza Ho y se concluiría que la desviación estándar no disminuyó. La decisión depende del error tipo I que esté dispuesto a tolerar el investigador.
Error tipo II ó 

El error tipo II se calcula de la misma forma en la que se calculó con la distribución z. Se realizarán algunos ejercicios en los cuales se determinará la probabilidad de cometer el error tipo II, utilizando la tabla de la distribución Ji-cuadrada.

  1. Se tiene un ensayo de hipótesis unilateral derecho, con n=20 y = 0.05

  2. Ho = 0.10
    H1 > 0.10
    Se quiere calcular el error tipo II ó  si las desviaciones estándar verdaderas fueran de 0.12 y 0.14.

    Solución:Para poder calcular el error tipo II, primero se debe encontrar el valor de la varianza muestral límite, esto es s2L, para poder calcular los valores de X2 y posteriormente calcular el área. Al buscar en la tabla X2(0.05,19)=30.144, este valor se sustituirá en la formula. Al despejar de la fórmula original de X2 se obtiene:



  3. Encontrar el error tipo II para el ejercicio 2 de esta sección, en donde el ensayo es bilateral pues se quiere ver si la varianza del contenido de azúcar en el almíbar de los duraznos ha cambiado. Suponga una varianza real de 20 y 26.


Solución:
Como este es un ensayo bilateral se tendrán dos valores de s2L. Los cuales se calcularán utilizando las ji-cuadradas límites que eran de de 2.7 y 19.023.

y
Estos dos valores se utilizarán para calcular las nuevas ji-cuadradas para calcular el valor de .