Slide 1 :1 Facultad de Química e Ingeniería Química UNMSM ESTADISTICA A - 02 jgarciap@unmsm.edu.pe
calidadtotal@hotmail.com
Slide 2 :2 Tema Nº 02: MEDIDAS DE POSICION, DISPERSION Y DEFORMACION Facultad de Química e Ingeniería Química Ing. Jose Manuel García Pantigozo 2008 - II UNMSM ESTADISTICA DESCRIPTIVA
Objetivos de Aprendizaje :3 Objetivos de Aprendizaje Calcular la media aritmética, la mediana y las moda.
Explicar las características, empleo, ventajas y desventajas de cada promedio.
Identificar la posición de la media aritmética, la mediana, la moda, tanto para distribuciones simétricas como asimétricas o sesgadas.
Objetivos de Aprendizaje :4 Objetivos de Aprendizaje Calcular varias medidas de dispersión para datos originales o no agrupados.
Calcular varias medidas de dispersión para datos organizados en una distribución de frecuencias.
Explicar las características, usos, ventajas y desventajas de cada una de las medidas de distribución discretas.
Calcular y aplicar el coeficiente de variación y del coeficiente de asimetría.
Analizar la curtosis de una distribución.
Slide 5 :5 MEDIDAS DE POSICION
Slide 6 :6 Estas medidas tienden a ubicarse en el centro del conjunto.
Proporcionan un valor simple y representativo, que resume un gran volumen de información. Media Aritmética
Media Geométrica
Media Armónica Moda
Mediana Medidas de Tendencia Central
Slide 7 :7 MEDIA
Slide 8 :8 Datos Agrupados: fi : Frec. relativa Clase i =
MCi : Marca Clase i
X : Media Aritmética
k : N° de clases
ni : Frec. absoluta Clase i
n : Tamaño Muestra
ai : Amplitud de Clase i _ å = k i i X i f 1 * X = Media Aritmética de una Muestra I
Slide 9 :9
Slide 10 :10 Datos NO Agrupados: å = n i i X 1 X = n X : Media Aritmética
Xi : i-ésimo valor observado
n : Tamaño Muestra Media Aritmética de una Muestra II
Slide 11 :11 å = n i i X 1 X = n 56191.5 X = 44 1277.1 X =
Slide 12 :12 Media de una Población
Slide 13 :13 Media Ponderada I Es un caso especial de la media aritmética. Se presenta cuando hay varias observaciones del mismo valor que pueden ocurrir si los datos se han agrupado en una distribución de frecuencias.
Slide 14 :14 Media Ponderada II 1541
Slide 15 :15 La media geométrica es otro estadígrafo de tendencia central, pero de poca utilización. El cálculo de la media geométrica se puede hacer en datos con frecuencia y datos sin frecuencias Datos sin Frecuencias
Media geométrica
Intervalos Cerrados
Datos Con Frecuencias
Inter. Cerrados / Abiertos Media Geométrica I
Slide 16 :16 Para el cálculo de la media geométrica sin frecuencias se aplica la siguientes expresión: Media Geométrica II
Slide 17 :17 Su media geométrica sería: Si los datos fueran los siguientes: Media Geométrica III
Slide 18 :18 Media Geométrica IV Para datos en tablas Frecuencias Se aplica la
siguiente
expresión:
Slide 19 :19 Media Geométrica V Para intervalos cerrados, se considera la marca de clase de cada intervalo por su frecuencia absoluta. La media Geométrica se calculará con el valor de la Marca de clase de los intervalos multiplicados con la frecuencias absoluta.
Slide 20 :20 Propiedades de la Media Todo conjunto de datos de nivel de intervalo y de nivel de razón tiene un valor medio.
Al evaluar la media se incluyen todos los valores.
Un conjunto de datos sólo tiene una media. Esta es un valor único.
La media es una medida muy útil para comparar dos o más poblaciones.
La media es la única medida de ubicación donde la suma de las desviaciones de cada valor es con respecto a la media, siempre será cero.
Slide 21 :21 MEDIANA
Slide 22 :22 Me = n + 1
2 Mediana I
Pares:Me = (49 +65)/2 = 57 :23 Pares:Me = (49 +65)/2 = 57 CALCULO DE LA MEDIANA EN DATOS NO AGRUPADOS Impares:Me = 64
Slide 24 :24 Datos Agrupados: L : Límite inferior Clase Mediana (C Me)
Ne-1 : Frec. Acumulada hasta antes (C Me)
ne : Frecuencia Absoluta (C Me)
ae : Amplitud (C Me)
n : Tamaño de la muestra e e-1 e n N n
2 a L Me ) ( - + = xe ae L ne Mediana II
Slide 25 :25 CALCULO DE LA MEDIANA EN DATOS AGRUPADOS
Slide 26 :26 Datos Agrupados: L : 1273.85
Ne-1 : 33
ne : 23
ae : 2.8
n : 110
: 1276.33 e e-1 e n N n
2 a L Me ) ( - + = xe ae L ne Me
Slide 27 :27 M
O
D
A
Slide 28 :28 La Moda Se define como “La moda” al valor que mas repite en una serie de datos.
Estos valores pueden ser:
Datos no agrupados
Datos agrupados en intervalos de clases
Slide 29 :29 La moda, cuando los datos no se encuentran en tabla de distribución de frecuencias, se establece los valores que mas se repiten. Por ejemplo: La Moda es: 2 La Moda
Slide 30 :30 La moda, cuando los datos no se encuentran en tabla de distribución de frecuencias, se establece los valores que mas se repiten. Por ejemplo: La Moda es: 2 y el 5,
es decir la serie de
nueceros sería
Bimodal La Moda
Slide 31 :31 La moda cuando los datos no se encuentran en tabla de distribución de frecuencias , se establece los valores que mas se repiten. Por ejemplo: La Moda
en este caso
no existiría. La Moda
Slide 32 :32 La moda, cuando los datos se encuentran en tabla de distribución de frecuencias, será el valor que posee mayor frecuencia. Por ejemplo: La Moda
es: 4 La Moda
Slide 33 :33 La moda , cuando los datos se encuentran en tabla de distribución de frecuencias , con intervalos de clase, se debe aplicar la siguiente Formula. Limite inferior del intervalo en en donde se encuentra la Moda
El “ “ es la diferencia en la frecuencia Absoluta mas cercana a la frecuencia de valor mayor.
El “ “ es la diferencia entre la frecuencia inmediatamente mayor a la frecuencia de mayor Valor.
El valor “c” corresponde al Tamaño del Intervalo La Moda
Slide 34 :34 Datos agrupados en intervalos de Clase Cerrados Limite inferior del Intervalo modal = 64, por que es de mayor Frecuencia
C = 4 Intervalo de mayor frecuencia La Moda
Slide 35 :35 Datos agrupados en intervalos de Clase Cerrados Intervalo de mayor frecuencia La Moda
Slide 36 :36 Moda para datos agrupados en intervalos de Clase Cerrados / Abiertos Cuando se trabaja con intervalos cerrados abiertos debemos considerar ahora “El limite Real Inferior” y el tamaño del Intervalo Varía en un dígito. Los demás valores Participan de la misma forma La Moda
Slide 37 :37 La Moda
Slide 38 :38
Slide 39 :39 0,0000 0,0500 0,1000 0,1500 0,2000 0,2500 0,3000 0,3500 0,4000 0,4500 0,5000 4 5 6 7 0 1 2 3 Q1 Q2 Q3 Q4 Moda Media
Aritmética Mediana Rango Medidas de Tendencia
Slide 40 :40 MEDIDAS DE DISPERSION
Slide 41 :41 Se llaman medidas de dispersión aquellas que permiten retratar la distancia de los valores de la variable a un cierto valor central, o que permiten identificar la concentración de los datos en un cierto sector del recorrido de la variable. Se trata de coeficiente para variables cuantitativas. Rango
Rango Intercuartílico
Varianza Muestral Desviación Media
Rango Percentil
Grafico de Cajas Medidas de Dispersión
Slide 42 :42 Dispersión: Amplitud Total Amplitud Total = Valor Mayor – Valor Menor
Slide 43 :43 Dispersión: Amplitud Cuartílica Amplitud Total = Valor Mayor – Valor Menor Amplitud Total =Q3 – Q1 e e-1 e n N n
4 a L Q1 ) ( - + = e e-1 e n N 3n
2 a L Q3 ) ( - + =
Slide 44 :44 Dispersión: Varianza Poblacional ό2 : Variancia Poblacional
µ : Media Poblacional
Xi : i-ésimo valor observado
N : Tamaño de la población
Slide 45 :45 Dispersión: Desviación Estándar Poblacional ό : Desviación Estándar Poblacional
µ : Media Poblacional
Xi : i-ésimo valor observado
N : Tamaño de la población
Slide 46 :46 Datos Agrupados: fi : Frec. relativa Clase i
Xi : Marca Clase i
X : Media Aritmética
ni : Frec. absoluta Clase i
n : Tamaño Muestra
k : N° de clases _ å = k i i f 1 2 ) ( S2 = _ Datos NO Agrupados: Dispersión: Varianza Muestral å = n i 1 2 ) ( S2 = _ s2 : Variancia Muestral
X : Media Aritmética
Xi : i-ésimo valor observado
n : Tamaño Muestra n - 1
Slide 47 :47 Datos Agrupados: fi : Frec. relativa Clase i
Xi : Marca Clase i
X : Media Aritmética
ni : Frec. absoluta Clase i
n : Tamaño Muestra
k : N° de clases _ å = k i i f 1 2 ) ( S = _ ae ne xi xi-1 xk _
x ni nk Datos NO Agrupados: Dispersión: Desviación Muestral å = n i - X X i 1 2 ) ( S = _ s. : Desviación Muestral
X : Media Aritmética
Xi : i-ésimo valor observado
n : Tamaño Muestra n - 1
Slide 48 :48 Datos Agrupados: Datos Agrupados: Dispersión: Desviación Media
Slide 49 :49 RQ = (Q3– Q1) / 2 xQ Desviación/Rango Inter-Cuartílico
Slide 50 :50 Dispersión: Amplitud Centílica e e-1 e n N 10n
100 a L 10º Centil ) ( - + = e e-1 e n N 90n
100 a L ) ( - + = 90º Centil
Slide 51 :51 MEDIDAS DE DISPERSION
Slide 52 :52 Coeficiente de Variación
Slide 53 :53 RP = (P90 – P10) Dispersión: Rango Percentil
Slide 54 :54 Representación visual para describir, simultáneamente, varias características importantes tales como
Centro
Dispersión
Desviación de la asimetría
Identificación de las observaciones (valores atípicos) D = Índice de Dispersión = (rangQ3- rangQ1) / (K-1) Gráficos de Cajas
Slide 55 :55 Comparaciones gráficas entre conjuntos de datos 1
2
3 70 80 90 100 110 120 Gráficos de Cajas
Slide 56 :56 a4 > 0 la Distribución de Frecuencias es leptocúrtica
a4 < 0 la Distribución de Frecuencias es platicúrtica
a4 = 0 la Distribución de Frecuencias es mesocúrtica Medidas de Apuntamiento
(Curtosis o Kurtosis) Pearson propuso el concepto de curtosis calculandolo mediante el coeficiente de curtosis de cuarto orden a4:
Slide 57 :57 k > 0 la Distribución de Frecuencias es leptocúrtica
k < 0 la Distribución de Frecuencias es platicúrtica
k = 0 la Distribución de Frecuencias es mesocúrtica Medidas de Apuntamiento
(Curtosis o Kurtosis) 0,263 (Q3 - Q1) K = Otra coeficiente para medir curtosis. En función de los percentiles, es el coeficiente de curtosis percentílico k: 1 2 P90 - P10
Slide 58 :58 3. Otros Estadígrafos: Relacionados con la forma
de la distribución de los datos (Polígono de Frecuencias). Asimetría (A): Simetría o Asimetría Kurtosis (K): Apuntamiento A= 0 A< 0 A> 0 K= 0.263 K< 0.263 K> 0.263
Slide 59 :59 3. Otros Estadígrafos: Relacionados con la forma
de la distribución de los datos (Polígono de Frecuencias). Asimetría (A): Simetría o Asimetría Kurtosis (K): Apuntamiento A= 0 A< 0 A> 0 K= 0.263 K< 0.263 K> 0.263
Slide 60 :60 3. Otros Estadígrafos: Relacionados con la forma
de la distribución de los datos (Polígono de Frecuencias). Asimetría (A): Simetría o Asimetría Kurtosis (K): Apuntamiento A= 0 A< 0 A> 0 K= 0.263 K< 0.263 K> 0.263
Slide 61 :61 3. Otros Estadígrafos: Relacionados con la forma
de la distribución de los datos (Polígono de Frecuencias). Asimetría (A): Simetría o Asimetría Kurtosis (K): Apuntamiento A= 0 A< 0 A> 0 K= 0.263 K< 0.263 K> 0.263
Slide 62 :62 3. Otros Estadígrafos: Relacionados con la forma
de la distribución de los datos (Polígono de Frecuencias). Asimetría (A): Simetría o Asimetría Kurtosis (K): Apuntamiento A= 0 A< 0 A> 0 K= 0.263 K< 0.263 K> 0.263
Slide 63 :63 3. Otros Estadígrafos: Relacionados con la forma
de la distribución de los datos (Polígono de Frecuencias). Asimetría (A): Simetría o Asimetría Kurtosis (K): Apuntamiento A= 0 A< 0 A> 0 K= 0.263 K< 0.263 K> 0.263
Slide 64 :64 Leptocúrtica: Cuando la distribución de frecuencias es más apuntada que la normal. Medidas de Apuntamiento
(Curtosis o Kurtosis) K= 0.263
Slide 65 :65 Mesocúrtica: Cuando la distribución de frecuencias es tan apuntada como la normal. Medidas de Apuntamiento
(Curtosis o Kurtosis) K> 0.263
Slide 66 :66 Platicúrtica: Cuando la distribución de frecuencias es menos apuntada que la normal. Medidas de Apuntamiento
(Curtosis o Kurtosis) K< 0.263
Slide 67 :67 Miden la mayor o menor simetría de la distribución. Existen dos medidas de este tipo: Medidas de Asimetría
(Sesgo) 1er Coeficiente de Asimetría: Desviación Estándar Media - Moda a1 =
Slide 68 :68 Medidas de Asimetría
(Sesgo) a1 > 0 la asimetría de la Distribución de Frecuencias es positiva
a1 < 0 la asimetría de la Distribución de Frecuencias es negativa
a1 = 0 la Distribución de Frecuencias es simétrica
Slide 69 :69 Medidas de Asimetría
(Sesgo) Coeficiente de Asimetría para datos sin agrupar: 3 s × å n 3 i=1 1 (xi-x) 1 a= N
Slide 70 :70 Medidas de Asimetría
(Sesgo) Coeficiente de Asimetría para datos agrupados
Slide 71 :71 Asimetría Positiva A< 0
Slide 72 :72 Asimetría Positiva
Mo < Me < X
Slide 73 :73 Simetría A= 0
Slide 74 :74 Simetría
Mo = Me = X
Slide 75 :75
Slide 76 :76 Ejercicio: Se desea determinar las características de resistencia a la ruptura bajo cargas de tensión del concreto ofrecido por cierto proveedor. Para ello se les solicita 125 probetas de 0,5 pies de diámetro por 1 pie de longuitud. La carga de tensión se mide en lb/pug2.
El laboratorio de resitencia de materiales proporciona la tabla de frecuencias
Clase Límites Marca Frecuencia Frecuencia Frecuencia Frecuencia
de Clase de Clase Absoluta Abs. Acuml. Relativa Relat. Acuml.
1 407,5- 412,5 410 4 4 0,032 0,032
2 412,5- 417,5 415 5 9 0,040 0,072
3 417,5- 422,5 420 8 17 0,064 0,136
4 422,5- 427,5 425 14 31 0,112 0,248
5 427,5- 432,5 430 13 44 0,104 0,352
6 432,5- 437,5 435 19 63 0,152 0,504
7 437,5- 442,5 440 20 83 0,160 0,664
8 442,5- 447,5 445 15 98 0,120 0,784
9 447,5- 452,5 450 12 110 0,096 0,880
10 452,5- 457,5 455 6 116 0,048 0,929
11 457,5- 462,5 460 7 123 0,056 0,984
12 462,5- 467,5 465 2 125 0,016 1,000
Determine: Todas las medidas de localización, escala, simetria y forma