STADISTIK06C2009

Views:
 
Category: Education
     
 

Presentation Description

No description available.

Comments

Presentation Transcript

Slide 1: 

Facultad de Química e Ingeniería Química Ing. José Manuel García Pantigozo 2009 - I UNMSM Distribución Chi Cuadrado (?2)

Objetivos de Aprendizaje : 

Objetivos de Aprendizaje Enumerar las características de la distribución chi-cuadrada (?2). Realizar una prueba de hipótesis relacionada con la diferencia entre conjunto de frecuencias observadas y un conjunto correspondiente de frecuencias esperadas. Llevar a cabo una prueba de hipótesis para determinar si están relacionados dos criterios de clasificación.

Pruebas de Bondad de Ajuste de Chi Cuadrada: Frecuencias Esperadas Iguales : 

Pruebas de Bondad de Ajuste de Chi Cuadrada: Frecuencias Esperadas Iguales

Pruebas de Bondad de Ajuste : 

Pruebas de Bondad de Ajuste Una de las bases fundamentales del control estadístico de la calidad es la inferencia estadística. Por ello, la determinación del tipo de distribución correspondiente a un conjunto de datos provenientes del estudio es absolutamente necesario. La prueba de bondad de ajuste permite probar el ajuste de los resultados de un experimento a una distribución de probabilidad teórica sujeto a un error o nivel de confianza.

Pruebas de Bondad de Ajuste : 

El método en cuestión se basa en la comparación de las frecuencias absolutas observadas y las frecuencias absolutas esperadas, calculadas a partir de la distribución teórica en análisis. Para la prueba de hipótesis utilizaremos el estadístico: Chi-cuadrado . Pruebas de Bondad de Ajuste

Ejemplo Nº 01 : 

Como implica el nombre completo, el objetivo de la prueba de bondad de ajuste de chi cuadrado es determinar cuán bien se ajusta a un conjunto observado de datos a un conjunto esperado. Supóngase que existen dudas respecto al funcionamiento correcto de una máquina tragamonedas del Palacio de Nerón, en Las Vegas; esto es, existe la sospecha de que está alterado el mecanismo de una de las ventanillas de la máquina. Como experimento se acciona 120 veces la palanca de la máquina y se registran los resultados, que se listan. Se desea responder: ¿se ha alterado el mecanismo de la máquina? Ejemplo Nº 01

Resultados de accionar 120 veces la máquina tragamonedas. : 

Resultados de accionar 120 veces la máquina tragamonedas.

Ejemplo Nº 01: Solución : 

Ejemplo Nº 01: Solución Paso 1: Se establece la hipótesis nula (H0) y la hipótesis alternativa (H1). La hipótesis nula (H0), es que el mecanismo no ha sido alterado, no existe diferencia entre el conjunto de frecuencias observadas y las esperadas, cualquier diferencia podría atribuirse al azar. La hipótesis alternativa, (H1), es que existe diferencia entre los dos conjuntos de frecuencias, mejor dicho, la máquina ha sido alterada. Si (H0), se rechaza y (H1) es aceptada, ello significa que la máquina fue alterada. Paso 2: Seleccionar el nivel de significación Se usará el nivel 0.05

Ejemplo Nº 01: Solución : 

Ejemplo Nº 01: Solución Paso 3: Seleccionar el estadístico de prueba Se selecciona chi cuadrado, con k-1 grados de libertad, donde k es el numero de categorías, f0 es la frecuencia de observada en una categoría específica y fe es una frecuencia esperada en una categoría específica.

Ejemplo Nº 01: Solución : 

Paso 4: Formular la regla de decisión Los valores críticos de ?2 se encuentran en la tabla a continuación: Grados de Libertad = k – 1 = df = 5 a = 0.05 ?2c = 11.070 (ver Tabla ?2 ) Ejemplo Nº 01: Solución

Slide 13: 

Ejemplo Nº 01: Solución

Ejemplo Nº 01: Solución : 

Ejemplo Nº 01: Solución ?2 C= 11.070 REGION DE ACEPTACION DE H0 REGION DE RECHAZO DE H0

Ejemplo Nº 01: Solución : 

Ejemplo Nº 01: Solución Paso 5: Calcular ?2 y tomar una decisión El valor calculado ?2 = 34.40 está en la zona de rechazo de la H0, por lo tanto se concluye que la máquina fue alterada.

Característicasde la Distribución ?2 : 

Característicasde la Distribución ?2 ?2 es siempre positivo porque es una suma de cuadrados. Varia desde 0 a ? (no tiene valores negativos). Familia de distribuciones que dependen de 1 parámetro (gl=grados de libertad). Media de la Distribución = gl. Varianza de la Distribución=2gl. La distribución tiene sesgo positivo y cuando los gl aumentan se aproxima a la distribución normal. Moda = gl-2 para gl?2 y 0 para gl=1.

Pruebas de Bondad de Ajuste de Chi Cuadrada: Frecuencias Esperadas Desiguales : 

Pruebas de Bondad de Ajuste de Chi Cuadrada: Frecuencias Esperadas Desiguales

Ejemplo Nº 02 : 

Un estudio nacional sobre el número de veces que fue hospitalizado un enfermo de la tercera edad durante un lapso de dos años reveló que 40% ingresó sólo una vez, 20% dos veces, 14% tres, 10% cuatro, 8% cinco, 6% seis y 2% siete. Un estudio del municipio de Tlalnepantla quiere comparar la experiencia del esta demarcación con las cifras nacionales. De este modo se toma una muestra de 400 enfermos de la tercera edad y se determina cuántas veces fueron hospitalizados, las frecuencias observadas se presentan en la siguiente tabla: Ejemplo Nº 02

Resultados de hospitalizaciones : 

Resultados de hospitalizaciones

Ejemplo Nº 02 : 

Obviamente el número de frecuencias locales no se puede compara con los porcentajes nacionales, sería como comparar peras con manzanas; pero los porcentajes nacionales se pueden convertir en frecuencias esperadas. Como ya se mencionó, a nivel nacional 40% de los enfermos de la tercera edad que necesitaron hospitalización en dos años, la necesitaron sólo una vez, así que si no hubiera diferencia entre las cifras de Tlalnepantla y las nacionales, entonces 40% de los cuatrocientos muestreados habrían sido hospitalizados sólo una vez durante este período, 20% de los 400 muestreados habrían sido hospitalizados dos veces y así sucesivamente. Ejemplo Nº 02

Ejemplo Nº 02 : 

Ejemplo Nº 02 Es decir, se esperaría que la frecuencia de hospitalizaciones en Tlalnepantla coincidiera con la frecuencia observada a nivel nacional. En la siguiente tabla se muestran las frecuencias observadas y las esperadas.

Ejemplo Nº 02: Solución : 

Ejemplo Nº 02: Solución Paso 1: Se establece la hipótesis nula (H0) y la hipótesis alternativa (H1). H0: fo = fe No hay diferencia entre la experiencia local y la experiencia nacional H1: fo ? fe Sí hay diferencia entre la experiencia local y la experiencia nacional Paso 2: Seleccionar el nivel de significación Se usará el nivel 0.05 Paso 3: Seleccionar el estadístico de prueba La estadística de prueba adecuada es ji cuadrada que se designa por ?2. Con k –1 grados de libertad.

Ejemplo Nº 02: Solución : 

Paso 4: Formular la regla de decisión Los valores críticos de ?2 se encuentran en la tabla a continuación: Grados de Libertad = k – 1 = df = 7 – 1 = 6 a = 0.05 ?2c = 12.592 (ver Tabla ?2 ) Ejemplo Nº 02: Solución

Slide 25: 

Ejemplo Nº 02: Solución

Ejemplo Nº 02: Solución : 

Ejemplo Nº 02: Solución ?2 C= 12.592 REGION DE ACEPTACION DE H0 REGION DE RECHAZO DE H0

Ejemplo Nº 02: Solución : 

Ejemplo Nº 02: Solución Paso 5: Calcular ?2 y tomar una decisión El valor calculado ?2 = 2.379 está en la zona de aceptación de la H0, por lo tanto se concluye que la situación del municipio respecto a la hospitalización de enfermos de la tercera edad es la misma que en otras partes del país.

Limitaciones de las Chi Cuadrado : 

La chi cuadrada puede llevar a conclusiones erróneas cuando en una celda (o en varias) se tiene una frecuencia esperada demasiado pequeña. Esto puede ocurrir porque las frecuencia esperadas aparecen en el denominador de la fórmula, y al dividir entre un número muy pequeño se obtiene un cociente muy grande. Existen dos reglas generales en relación con las celdas con frecuencias muy pequeñas: Si sólo hay dos celdas (tablas de 2 X 2), la frecuencia esperada en cada celda debe ser de 5 o más. De otro modo no se puede utilizar la ji cuadrada. Si hay más de dos celdas, no se debe utilizar la ji cuadrada cuando más del 20% de las celdas tienen una frecuencia esperada menor a 5. Limitaciones de las Chi Cuadrado

Análisis de Tablas de Contingencia : 

Análisis de Tablas de Contingencia

Análisis de Tablas de Contingencia : 

En las pruebas de bondad y ajuste que vimos anteriormente, se analizaba únicamente una variable y un rasgo. Sin embargo, la prueba de chi cuadrada también se puede utilizar cuando se analizan dos rasgos a ala vez. En estos casos, se utiliza para saber si existe alguna relación entre estos dos rasgos. Análisis de Tablas de Contingencia

Ejemplo Nº 03 : 

El Centro de Readaptación Social (CERESO) de la ciudad de Tamaulipas, quiere investigar si es diferente la readaptación a la vida civil de un hombre liberado de prisión, si regresa a vivir en su lugar de origen, o si se va vivir a otro lado. Dicho de otra forma, ¿existe alguna relación entre la readaptación a la vida civil y el lugar de residencia después de haber sido liberado de prisión? Los psicólogos del CERESO de Tamaulipas entrevistaron a una muestra aleatoria de 200 prisioneros ya liberados, y con base en los resultados, clasificaron su readaptación como excelente, buena, regular e insatisfactoria. En la siguiente tabla se muestran los resultados obtenidos para esta muestra. Ejemplo Nº 03

Ejemplo Nº 03 : 

Ejemplo Nº 03

Ejemplo Nº 03: Solución : 

Ejemplo Nº 03: Solución Paso 1: Se establece la hipótesis nula (H0) y la hipótesis alternativa (H1). H0: No hay relación entre la readaptación a la vida civil y el lugar en donde vive el individuo después de haber sido liberado de prisión. H1: Hay relación entre la readaptación a la vida civil y el lugar en donde vive el individuo después de haber sido liberado de prisión. Paso 2: Seleccionar el nivel de significación Se usará el nivel 0.01

Ejemplo Nº 03: Solución : 

Ejemplo Nº 03: Solución Paso 3: Seleccionar el estadístico de prueba La estadística de prueba adecuada es ji cuadrada que se designa por ?2. Con k –1 grados de libertad. Para conocer las frecuencias observadas se utiliza la siguiente fórmula:

Ejemplo Nº 03: Solución : 

Paso 4: Formular la regla de decisión El valor crítico se encuentra utilizando la tabla de la distribución de ?2. Para conocer los grados de libertad se utiliza la siguiente fórmula: gl = (número de renglones – 1) (número de columnas – 1) gl = (r –1) (c –1) = (2 – 1) (4 – 1) = 3 El nivel de significancia, como ya se determinó es a = 0.01. Luego entonces, buscando en las tablas de la distribución de chi cuadrada, se obtiene el valor crítico de 11.345. La regla de decisión es entonces: No rechazar H0 si el valor que se encuentre para ?2 es menor que 11.345. Si el valor calculado es igual o mayor al valor crítico, se rechaza H0 y se acepta H1. Ejemplo Nº 03: Solución

Slide 36: 

Ejemplo Nº 03: Solución

Ejemplo Nº 03: Solución : 

Ejemplo Nº 03: Solución ?2 C= 11.345 REGION DE ACEPTACION DE H0 REGION DE RECHAZO DE H0

Ejemplo Nº 03: Solución : 

Ejemplo Nº 03: Solución Paso 5: Calcular ?2 y tomar una decisión El valor calculado ?2 = 5.729 está en la zona de aceptación de la H0, entonces se concluye que no hay relación entre la readaptación a la vida civil y el lugar donde residan los prisioneros después de ser liberados. Sustituyendo la fórmula para el cálculo de chi cuadrada y comenzando por la celda superior izquierda, tenemos:

authorStream Live Help