2010 II - ESTADISTICA - CLASE N� 10

Views:
 
Category: Education
     
 

Presentation Description

No description available.

Comments

Presentation Transcript

Slide 1: 

Tema Nº 10: ANALISIS DE VARIANZA - ANOVA Facultad de Química e Ingeniería Química E.A.P. de Química Ing. José Manuel García Pantigozo 2010 - II UNMSM ESTADISTICA A

Objetivos de Aprendizaje : 

Objetivos de Aprendizaje Comprender la noción general del análisis de variancia (ANOVA). Proporcionar las características de la distribución F. Realizar una prueba de hipótesis para determinar si dos variancias muestrales provienen de las mismas poblaciones o de poblaciones iguales.

Objetivos de Aprendizaje : 

3 Objetivos de Aprendizaje Establecer y organizar datos en una tabla de ANOVA. Realizar una prueba para determinar si existe diferencia entre tres o más medias de tratamiento. Realizar una prueba de hipótesis para determinar si hay alguna diferencia entre medias de bloques.

DISTRIBUCION F : 

4 DISTRIBUCION F La necesidad de disponer de métodos estadísticos para comparar las varianzas de dos poblaciones es evidente a partir del análisis de una sola población. Frecuentemente se desea comparar la precisión de un instrumento de medición con la de otro, la estabilidad de un proceso de manufactura con la de otro o hasta la forma en que varía el procedimiento para calificar de un profesor universitario con la de otro. Es simétrica. Normalmente se consideran valores anómalos los de la cola de la derecha.

DISTRIBUCION F : 

5 DISTRIBUCION F Existe una familia de distribuciones F. Un elemento especifico de la familia esta determinado por dos parámetros: los grados de libertad del numerador y los grados de libertad del denominador. Hay una distribución F para 29 g.l. en el numerador y 28 g.l. en el denominador. El valor de F no puede ser negativo. La función F es una función continua. La curva representa que representa una distribución F tiene un sesgo positivo.

COMPARACION DE DOS VARIANCIAS POBLACIONALES : 

6 COMPARACION DE DOS VARIANCIAS POBLACIONALES La distribución F se utiliza para demostrar la hipótesis de que la varianza de una población normal es igual a la varianza de una población normal. Ejemplo: Dos cizallas Barth se ajustan para producir elementos de acero de la misma longitud. Por tanto, los elementos deben tener la misma longitud. Se desea estar seguro que además de tener la misma longitud, tengan una varianza similar.

COMPARACION DE DOS VARIANCIAS POBLACIONALES : 

7 COMPARACION DE DOS VARIANCIAS POBLACIONALES La tasa media de rendimiento de la inversión de dos tipos de acciones puede ser la misma, pero hay mas variación en el rendimiento de una que en otra. una muestra de 10 acciones de industria aeroespacial y 10 acciones de servicios podrían mostrar la misma tasa media de rendimiento, pero es mas probable que haya mas variación en el rendimiento de las acciones aeroespaciales.

CONSIDERACIONES DE VALIDACION : 

8 CONSIDERACIONES DE VALIDACION La prueba F también puede usarse para validar supuestos con respecto a ciertas pruebas estadísticas. Ejemplo 01: Lammers Limos ofrece servicio de limusinas desde el edificio del ayuntamiento de Toledo, Ohio, al aeropuerto Metro en Detroit. El director de la compañía esta considerando dos rutas. Una es según la pista 25 y la otra la I-75. Desea hacer un estudio para ambas rutas y después compara los resultados. Registro los siguientes datos. Si se utiliza el nivel de significación de 0.10. ¿existe una diferencia en la variación en las dos rutas?

Slide 9: 

9 SOLUCIÓN 01: Paso 1: Plantear la hipótesis nula (H0) y la hipótesis alternativa (H1) La prueba es de dos colas ya que se busca la diferencia en la variación de las dos rutas. No se trata de manifestar que una ruta tiene mas variación . (H0): σ12 = σ22 & (H1): σ12 ≠ σ22 Paso 2: Seleccionar el nivel de significación Se usara el nivel 0.10 Paso 3: Proporcionar el estadístico de prueba El estadístico de prueba es la distribución F

Slide 11: 

11 Paso 4: Formular la regla de decisión Como α = 0.10, y como son dos colas, entonces tenemos que α/2 = 0.05 (para cada cola). Buscamos en la tabla y encontramos que el valor es 3.87 Paso 5: Calcular F y tomar una decisión Puesto que 5.76 se encuentra en la región de rechazo, la hipótesis nula que es (H0): σ12 = σ22 se rechaza al nivel del 10% (0.10). Esto indica que la variación no es igual en las dos poblaciones,

ANOVA : NOCION GENERAL : 

ANOVA : NOCION GENERAL Tratamiento: Causa o fuente especifica de variación en un conjunto de datos. Consideraciones: Las tres o mas poblaciones de interés están distribuidas normalmente. Tales poblaciones tienen desviaciones estándares iguales. Las muestras que se seleccionan de cada una de las poblaciones son aleatorias e independientes, es decir, no están relacionados entre si.

PROCEDIMIENTO DE ANOVA : 

13 PROCEDIMIENTO DE ANOVA Ejemplo 02: Suponga que renuncio el gerente de la sucursal de Apliance Stores Inc., y se considera que tres vendedores puedan ocupar este puesto. Los tres tienen la misma antigüedad, educación, etc. Para tomar una decisión, se sugirió examinar los registros de ventas mensuales de cada uno. En la tabla se muestran los resultados muestrales de las ventas por mes. En este “problema” los vendedores son los tratamientos.

Slide 14: 

SOLUCIÓN 01: Paso 1: Plantear (H0) y la (H1) H0 expresa que no hay diferencias significativas entre las ventas medias de los tres vendedores; es decir, µ1=µ2=µ3.. H1,plantea que al menos una media es diferente. Paso 2: Seleccionar el nivel de significación Se usara el nivel 0.05 Paso 3: Proporcionar el estadístico de prueba El estadístico de prueba es la distribución F. F = Varianza poblacional estimada según variación entre medias muestrales Varianza poblacional estimada según la variación en las muestraes

Slide 16: 

16 Paso 4: Formular la regla de decisión Como α = 0.05 Buscamos en la tabla y encontramos que el valor es 3.89

Slide 17: 

17 Paso 5: Calcular F y tomar una decisión

Slide 18: 

18 PARA CALCULAR SST: SST = Σ(T2c/nc) – (ΣX)2/N SST = ( (55)2/5 + (60)2/5 + (80)2/5) – (195)2/15 SST = 2605 – 2535 = 70 Paso 5: Calcular F y tomar una decisión (cont.) PARA CALCULAR SSE: SSE = Σ(X2) - Σ(T2c/nc) SSE = (15)2 + (10)2 + (9)2 +…….…+ (17)2 – ((55)2/5 + (60)2/5 + (80)2/5) SSE = 2727 – 2605 = 122 PARA CALCULAR SS: Total SS = Σ(X2) – (ΣX2)/N Total SS = 2727 –(195)2/15 Total SS = 2727 - 2535 = 192

Slide 19: 

19 Paso 5: Calcular F y tomar una decisión F = MSTR/MSE = 35/10.17 = 3.44

Slide 20: 

20 Paso 5: Calcular F y tomar una decisión F = 35/10.17 = 3.44

CONSIDERACIONES DE VALIDACION : 

21 CONSIDERACIONES DE VALIDACION Ejemplo 03: Se quiere evaluar la eficacia de distintas dosis de un fármaco contra la hipertensión arterial, comparándola con la de una dieta sin sal. Para ello se seleccionan al azar 25 hipertensos y se distribuyen aleatóriamente en 5 grupos. Al primero de ellos no se le suministra ningún tratamiento, al segundo una dieta con un contenido pobre en sal, al tercero una dieta sin sal, al cuarto el fármaco a una dosis determinada y al quinto el mismo fármaco a otra dosis. Las presiones arteriales sistólicas de los 25 sujetos al finalizar los tratamientos son:

Slide 22: 

22 Como F0,05(4,20) =2,87 y 11,24>2,87 rechazamos la hipótesis nula y concluimos que los resultados de los tratamientos son diferentes. Nota: Para hacerlo con un paquete estadístico, p.e. el SPSS, deberíamos crear un archivo con 2 variables: Trata (con un código distinto para cada grupo, p.e. de 1 a 5) y Presion con la presión arterial de cada individuo al acabar el estudio. Para calcular el Anova desplegamos los menús que se ven en la gráfica:

Slide 23: 

23

1er Ejemplo – pag 455 : 

24 1er Ejemplo – pag 455 2do Ejemplo – pag 455

3er Ejemplo – pag 456 : 

25 3er Ejemplo – pag 456

(EJERCICIO 3 PAG. 462) : 

26 (EJERCICIO 3 PAG. 462) Ejemplo 04:

Slide 27: 

27 Como F0,05(2,9) =4,26 y 14,179>2,87 rechazamos la hipótesis nula y concluimos que los resultados de los tratamientos son diferentes. Nota: Para hacerlo con un paquete estadístico, p.e. el SPSS, deberíamos crear un archivo con 2 variables: Trata (con un código distinto para cada grupo, p.e. de 1 a 4) y Area. Para calcular el Anova desplegamos los menús que se ven en la gráfica:

Slide 28: 

28

(EJERCICIO 4 PAG. 462) : 

29 (EJERCICIO 4 PAG. 462) (Ejemplo - PAG. 462)

(AUTOEXAMEN 12-2) : 

30 (AUTOEXAMEN 12-2) (AUTOEXAMEN 12-3)

(Ejercicio 5 – pag. 469) : 

31 (Ejercicio 5 – pag. 469) (Ejercicio 6 – pag. 469)

ANOVA EN DOS SENTIDOS : 

ANOVA EN DOS SENTIDOS Ejemplo 05: Tawa, esta ampliando el servicio de autobuses desde de el Megacite a Unicote, para esto utiliza las rutas R1, R2, R3 y R4. Tawa, realizo recorridos de prueba para determinar si hay diferencia significativa en los tiempos medios del trayecto en las cuatro rutas los cuales están en minutos: Al nivel de significancia 0.05, ¿puede concluirse que hay diferencia en las cuatro rutas? ¿Existe diferencia dependiendo de que día de la semana se trata?

Slide 33: 

33 F = MSTR/MSE =

Slide 34: 

34 PARA CALCULAR SST: SST = Σ(T2c/nc) – (ΣX)2/N SST=((110)2/5 + (110)2/5 + (125)2/5) + (119)2/5) – (464)2/20 SST = 32.4 Calcular F y tomar una decisión (cont.) PARA CALCULAR SSB: SSE = Σ(B2n) = (80)2/4 +(91)2/4+(91)2/4+(99)2/4+(103)2/4 - (464)2/20 = 78.2 PARA CALCULAR SS: Total SS = Σ(X2) – (ΣX2)/N Total SS = 10904 - (464)2/20 = 139.2 PARA CALCULAR SSE: Total SS = Σ(X2) – (ΣX2)/N 139.2 -32.4 -78.2 = 28.6

Slide 35: 

F = MSTR/MSE = 10.80/2.38= 4.54 (TRATAMIENTOS) F = MSB/MSE = 19.55/2.38= 4.54 (BLOQUES)

(Ejemplo – pag. 470) : 

(Ejemplo – pag. 470)