ESTADÍSTICA DESCRIPTIVA II

Download as
 PPT
Presentation Description 

No description available

Views: 765
Like it  ( Likes) Dislike it  ( Dislikes)
Added: March 26, 2009 This Presentation is Public 
Presentation Category : Education All Rights Reserved
Presentation Transcript

Slide 1:1 Tema Nº 02: MEDIDAS DE POSICION, DISPERSION Y DEFORMACION Facultad de Química e Ingeniería Química Ing. Jose Manuel García Pantigozo 2009 - I UNMSM ESTADISTICA - A


Objetivos de Aprendizaje :2 Objetivos de Aprendizaje Calcular la media aritmética, la mediana y las moda. Explicar las características, empleo, ventajas y desventajas de cada promedio. Identificar la posición de la media aritmética, la mediana, la moda, tanto para distribuciones simétricas como asimétricas o sesgadas.


Objetivos de Aprendizaje :3 Objetivos de Aprendizaje Calcular varias medidas de dispersión para datos originales o no agrupados. Calcular varias medidas de dispersión para datos organizados en una distribución de frecuencias. Explicar las características, usos, ventajas y desventajas de cada una de las medidas de distribución discretas. Calcular y aplicar el coeficiente de variación y del coeficiente de asimetría. Analizar la curtosis de una distribución.


Slide 4:4 MEDIDAS DE POSICION


Slide 5:5 Estas medidas tienden a ubicarse en el centro del conjunto. Proporcionan un valor simple y representativo, que resume un gran volumen de información. Media Aritmética Media Geométrica Media Armónica Moda Mediana Medidas de Tendencia Central


Slide 6:6 MEDIA


Slide 7:7 Datos Agrupados: fi : Frec. relativa Clase i = MCi : Marca Clase i X : Media Aritmética k : N° de clases ni : Frec. absoluta Clase i n : Tamaño Muestra ai : Amplitud de Clase i _ å = k i i X i f 1 * X = Media Aritmética de una Muestra I


Slide 8:8


Slide 9:9 Datos NO Agrupados: å = n i i X 1 X = n X : Media Aritmética Xi : i-ésimo valor observado n : Tamaño Muestra Media Aritmética de una Muestra II


Slide 10:10 å = n i i X 1 X = n 56191.5 X = 44 1277.1 X =


Slide 11:11 Media de una Población


Slide 12:12 Media Ponderada I Es un caso especial de la media aritmética. Se presenta cuando hay varias observaciones del mismo valor que pueden ocurrir si los datos se han agrupado en una distribución de frecuencias.


Slide 13:13 Media Ponderada II 1541


Slide 14:14 La media geométrica es otro estadígrafo de tendencia central, pero de poca utilización. El cálculo de la media geométrica se puede hacer en datos con frecuencia y datos sin frecuencias Datos sin Frecuencias Media geométrica Intervalos Cerrados Datos Con Frecuencias Inter. Cerrados / Abiertos Media Geométrica I


Slide 15:15 Para el cálculo de la media geométrica sin frecuencias se aplica la siguientes expresión: Media Geométrica II


Slide 16:16 Su media geométrica sería: Si los datos fueran los siguientes: Media Geométrica III


Slide 17:17 Media Geométrica IV Para datos en tablas Frecuencias Se aplica la siguiente expresión:


Slide 18:18 Media Geométrica V Para intervalos cerrados, se considera la marca de clase de cada intervalo por su frecuencia absoluta. La media Geométrica se calculará con el valor de la Marca de clase de los intervalos multiplicados con la frecuencias absoluta.


Slide 19:19 Propiedades de la Media Todo conjunto de datos de nivel de intervalo y de nivel de razón tiene un valor medio. Al evaluar la media se incluyen todos los valores. Un conjunto de datos sólo tiene una media. Esta es un valor único. La media es una medida muy útil para comparar dos o más poblaciones. La media es la única medida de ubicación donde la suma de las desviaciones de cada valor es con respecto a la media, siempre será cero.


Slide 20:20 MEDIANA


Slide 21:21 Me = n + 1 2 Mediana I


Pares:Me = (49 +65)/2 = 57 :22 Pares:Me = (49 +65)/2 = 57 CALCULO DE LA MEDIANA EN DATOS NO AGRUPADOS Impares:Me = 64


Slide 23:23 Datos Agrupados: L : Límite inferior Clase Mediana (C Me) Ne-1 : Frec. Acumulada hasta antes (C Me) ne : Frecuencia Absoluta (C Me) ae : Amplitud (C Me) n : Tamaño de la muestra e e-1 e n N n 2 a L Me ) ( - + = xe ae L ne Mediana II


Slide 24:24 CALCULO DE LA MEDIANA EN DATOS AGRUPADOS


Slide 25:25 Datos Agrupados: L : 1273.85 Ne-1 : 33 ne : 23 ae : 2.8 n : 110 : 1276.33 e e-1 e n N n 2 a L Me ) ( - + = xe ae L ne Me


Slide 26:26 M O D A


Slide 27:27 La Moda Se define como “La moda” al valor que mas repite en una serie de datos. Estos valores pueden ser: Datos no agrupados Datos agrupados en intervalos de clases


Slide 28:28 La moda, cuando los datos no se encuentran en tabla de distribución de frecuencias, se establece los valores que mas se repiten. Por ejemplo: La Moda es: 2 La Moda


Slide 29:29 La moda, cuando los datos no se encuentran en tabla de distribución de frecuencias, se establece los valores que mas se repiten. Por ejemplo: La Moda es: 2 y el 5, es decir la serie de nueceros sería Bimodal La Moda


Slide 30:30 La moda cuando los datos no se encuentran en tabla de distribución de frecuencias , se establece los valores que mas se repiten. Por ejemplo: La Moda en este caso no existiría. La Moda


Slide 31:31 La moda, cuando los datos se encuentran en tabla de distribución de frecuencias, será el valor que posee mayor frecuencia. Por ejemplo: La Moda es: 4 La Moda


Slide 32:32 La moda , cuando los datos se encuentran en tabla de distribución de frecuencias , con intervalos de clase, se debe aplicar la siguiente Formula. Limite inferior del intervalo en en donde se encuentra la Moda El “ “ es la diferencia en la frecuencia Absoluta mas cercana a la frecuencia de valor mayor. El “ “ es la diferencia entre la frecuencia inmediatamente mayor a la frecuencia de mayor Valor. El valor “c” corresponde al Tamaño del Intervalo La Moda


Slide 33:33 Datos agrupados en intervalos de Clase Cerrados Limite inferior del Intervalo modal = 64, por que es de mayor Frecuencia C = 4 Intervalo de mayor frecuencia La Moda


Slide 34:34 Datos agrupados en intervalos de Clase Cerrados Intervalo de mayor frecuencia La Moda


Slide 35:35 Moda para datos agrupados en intervalos de Clase Cerrados / Abiertos Cuando se trabaja con intervalos cerrados abiertos debemos considerar ahora “El limite Real Inferior” y el tamaño del Intervalo Varía en un dígito. Los demás valores Participan de la misma forma La Moda


Slide 36:36 La Moda


Slide 37:37 UNIMODAL


Slide 38:38 BIMODAL


Slide 39:39 0,0000 0,0500 0,1000 0,1500 0,2000 0,2500 0,3000 0,3500 0,4000 0,4500 0,5000 4 5 6 7 0 1 2 3 Q1 Q2 Q3 Q4 Moda Media Aritmética Mediana Rango Medidas de Tendencia


Slide 40:40 MEDIDAS DE DISPERSION


Slide 41:41 Se llaman medidas de dispersión aquellas que permiten retratar la distancia de los valores de la variable a un cierto valor central, o que permiten identificar la concentración de los datos en un cierto sector del recorrido de la variable. Se trata de coeficiente para variables cuantitativas. Rango Rango Intercuartílico Varianza Muestral Desviación Media Rango Percentil Grafico de Cajas Medidas de Dispersión


Slide 42:42 Dispersión: Amplitud Total Amplitud Total = Valor Mayor – Valor Menor


Slide 43:43 Dispersión: Amplitud Cuartílica Amplitud Total = Valor Mayor – Valor Menor Amplitud Total =Q3 – Q1 e e-1 e n N n 4 a L Q1 ) ( - + = e e-1 e n N 3n 2 a L Q3 ) ( - + =


Slide 44:44 Dispersión: Varianza Poblacional ?2 : Variancia Poblacional µ : Media Poblacional Xi : i-ésimo valor observado N : Tamaño de la población


Slide 45:45 Dispersión: Desviación Estándar Poblacional ? : Desviación Estándar Poblacional µ : Media Poblacional Xi : i-ésimo valor observado N : Tamaño de la población


Slide 46:46 Datos Agrupados: fi : Frec. relativa Clase i Xi : Marca Clase i X : Media Aritmética ni : Frec. absoluta Clase i n : Tamaño Muestra k : N° de clases _ å = k i i f 1 2 ) ( S2 = _ Datos NO Agrupados: Dispersión: Varianza Muestral å = n i 1 2 ) ( S2 = _ s2 : Variancia Muestral X : Media Aritmética Xi : i-ésimo valor observado n : Tamaño Muestra n - 1


Slide 47:47 Datos Agrupados: fi : Frec. relativa Clase i Xi : Marca Clase i X : Media Aritmética ni : Frec. absoluta Clase i n : Tamaño Muestra k : N° de clases _ å = k i i f 1 2 ) ( S = _ ae ne xi xi-1 xk _ x ni nk Datos NO Agrupados: Dispersión: Desviación Muestral å = n i - X X i 1 2 ) ( S = _ s. : Desviación Muestral X : Media Aritmética Xi : i-ésimo valor observado n : Tamaño Muestra n - 1


Slide 48:48 Datos Agrupados: Datos Agrupados: Dispersión: Desviación Media


Slide 49:49 RQ = (Q3– Q1) / 2 xQ Desviación/Rango Inter-Cuartílico


Slide 50:50 Dispersión: Amplitud Centílica e e-1 e n N 10n 100 a L 10º Centil ) ( - + = e e-1 e n N 90n 100 a L ) ( - + = 90º Centil


Slide 51:51 MEDIDAS DE DISPERSION


Slide 52:52 Coeficiente de Variación


Slide 53:53 RP = (P90 – P10) Dispersión: Rango Percentil


Slide 54:54 Representación visual para describir, simultáneamente, varias características importantes tales como Centro Dispersión Desviación de la asimetría Identificación de las observaciones (valores atípicos) D = Índice de Dispersión = (rangQ3- rangQ1) / (K-1) Gráficos de Cajas


Slide 55:55 Comparaciones gráficas entre conjuntos de datos 1 2 3 70 80 90 100 110 120 Gráficos de Cajas


Slide 56:56 a4 > 0 la Distribución de Frecuencias es leptocúrtica a4 < 0 la Distribución de Frecuencias es platicúrtica a4 = 0 la Distribución de Frecuencias es mesocúrtica Medidas de Apuntamiento (Curtosis o Kurtosis) Pearson propuso el concepto de curtosis calculandolo mediante el coeficiente de curtosis de cuarto orden a4:


Slide 57:57 k > 0 la Distribución de Frecuencias es leptocúrtica k < 0 la Distribución de Frecuencias es platicúrtica k = 0 la Distribución de Frecuencias es mesocúrtica Medidas de Apuntamiento (Curtosis o Kurtosis) 0,263 (Q3 - Q1) K = Otra coeficiente para medir curtosis. En función de los percentiles, es el coeficiente de curtosis percentílico k: 1 2 P90 - P10


Slide 58:58 3. Otros Estadígrafos: Relacionados con la forma de la distribución de los datos (Polígono de Frecuencias). Asimetría (A): Simetría o Asimetría Kurtosis (K): Apuntamiento A= 0 A 0 K= 0.263 K 0.263


Slide 59:59 Leptocúrtica: Cuando la distribución de frecuencias es más apuntada que la normal. Medidas de Apuntamiento (Curtosis o Kurtosis) K= 0.263


Slide 60:60 Platicúrtica: Cuando la distribución de frecuencias es menos apuntada que la normal. Medidas de Apuntamiento (Curtosis o Kurtosis) K< 0.263


Slide 61:61 Miden la mayor o menor simetría de la distribución. Existen dos medidas de este tipo: Medidas de Asimetría (Sesgo) 1er Coeficiente de Asimetría: Desviación Estándar Media - Moda a1 =


Slide 62:62 Medidas de Asimetría (Sesgo) a1 > 0 la asimetría de la Distribución de Frecuencias es positiva a1 < 0 la asimetría de la Distribución de Frecuencias es negativa a1 = 0 la Distribución de Frecuencias es simétrica


Slide 63:63 Medidas de Asimetría (Sesgo) Coeficiente de Asimetría para datos sin agrupar: 3 s × å n 3 i=1 1 (xi-x) 1 a= N


Slide 64:64 Medidas de Asimetría (Sesgo) Coeficiente de Asimetría para datos agrupados


Slide 65:65 Asimetría Positiva A< 0


Slide 66:66 Asimetría Positiva Mo < Me < X


Slide 67:67 Simetría A= 0


Slide 68:68 Simetría Mo = Me = X


Slide 69:69


Slide 70:70 Ejercicio: Se desea determinar las características de resistencia a la ruptura bajo cargas de tensión del concreto ofrecido por cierto proveedor. Para ello se les solicita 125 probetas de 0,5 pies de diámetro por 1 pie de longuitud. La carga de tensión se mide en lb/pug2. El laboratorio de resitencia de materiales proporciona la tabla de frecuencias Clase Límites Marca Frecuencia Frecuencia Frecuencia Frecuencia de Clase de Clase Absoluta Abs. Acuml. Relativa Relat. Acuml. 1 407,5- 412,5 410 4 4 0,032 0,032 2 412,5- 417,5 415 5 9 0,040 0,072 3 417,5- 422,5 420 8 17 0,064 0,136 4 422,5- 427,5 425 14 31 0,112 0,248 5 427,5- 432,5 430 13 44 0,104 0,352 6 432,5- 437,5 435 19 63 0,152 0,504 7 437,5- 442,5 440 20 83 0,160 0,664 8 442,5- 447,5 445 15 98 0,120 0,784 9 447,5- 452,5 450 12 110 0,096 0,880 10 452,5- 457,5 455 6 116 0,048 0,929 11 457,5- 462,5 460 7 123 0,056 0,984 12 462,5- 467,5 465 2 125 0,016 1,000 Determine: Todas las medidas de localización, escala, simetria y forma