1. INTRODUCCIÓN A LA ESTADISTICA DESCRIPTIVA Y EXPLORATORIA

Views:
 
Category: Entertainment
     
 

Presentation Description

No description available.

Comments

Presentation Transcript

Slide 1: 

INICIACIÓN A LA ESTADÍSTICA EXPLORATORIA Preparado por: José Cajas

Slide 2: 

Estadística descriptiva : Conjunto de herramientas que permiten resumir y representar la información de una tabla estadística. (simplificación y esquematización) Sabemos que... Estadística descriptiva multidimensional...

Slide 3: 

La estadística exploratoria es una estadística descriptiva y además es... una gama de instrumentos de análisis, de descubrimiento, de verificación o de prueba de hipótesis de trabajo... a partir de una tabla estadística. La estadística exploratoria es “algo más” que una estadística descriptiva… en efecto... Pero, ¿qué es la estadística exploratoria…?

Slide 4: 

¿es un instrumento de descripción? ¿o es un instrumento de exploración ...? ¿cuáles son las características de los instrumentos de exploración? Razonemos a partir de un ejemplo : el microscopio

Slide 5: 

Supongamos que hay razones para esperar que la lamina que analizamos presente bacilos de Koch... ¿qué veríamos en el microscopio? ¿qué debemos hacer para que el microscopio nos muestre la presencia de bacilos de Koch?

Slide 6: 

- una metodología de exploración pertinente - un instrumento de exploración adecuado El microscopio no es solo una herramienta de descripción, es un instrumento de exploración de la materia biológica. El proceso de análisis del biólogo tiene dos componentes esenciales:

Slide 7: 

* manera de organizar la observación de los “problemas” a resolver. * manera de elegir los tratamientos esta- dísticos pertinentes para resolver esos problemas a partir de los datos. - herramientas estadísticas adecuadas - reglas metodológicas de observación y de tratamiento de los datos para el “tratamiento” de las informaciones contenidas en una tabla estadística. La Estadística Exploratoria se compone de un doble conjunto de : de la misma manera :

Slide 8: 

La observación es un proceso que se cumple en tres etapas: Por ello, debemos... - definir lo que es una observación, - esclarecer el lugar que ocupan los métodos estadísticos en la observación-exploración de un fenómeno... 1. El observador percibe el objeto 2. El observador compara e interpreta el resultado de la comparación 3. El observador describe lo que percibe apoyándose en proposiciones que transforma en “datos”.

Slide 9: 

Nos interesamos por los procesos de observación que están ligados a la producción de conocimientos 3. se orienta hacia un objeto para recoger informaciones, 2. está orientado hacia un objetivo terminal u organizador, Definición del proceso de observación Observar es un proceso que... 1. Incluye la atención selectiva e inteligente, Se selecciona información en el conjunto de informaciones posibles La observación sin objetivo es imposible. La información bruta es traducida en “códigos” para conservarla, elaborarla o transmitirla. 4. Que serán transmitidas... La observación supone la comunicación de resultados.

Slide 10: 

Esquema del proceso de observación Percepción Reconocimiento Evaluación (diagnostico) Investigación heurística Experi- menta- ción Hechos conceptos Decisiones (soluciones) Hipótesis Conclusiones modelos Objetivo Investigación descriptiva

Slide 11: 

Reducciones del proceso de observación Privilegiando las «técnicas de observación» en detrimento del «proceso de observación» Considerando la «experimentación» como la única forma de observación científica Subordinando la «observación» a la «modelización»

Slide 13: 

Introducción Análisis de la información contenida en una Tabla Estadística de tipo “individuos x var. cuantitativas”

Slide 14: 

Verificar que comprendemos esos conceptos

Slide 15: 

I. Tabla de Datos La Tabla de Datos resume la observación Resumen Conservación de las observaciones en una tabla rectangular de datos Selección: de atributos observables de un conjunto de unidades de observación Operaciones de campo: « medición » de esas características para esas unidades de observación

Slide 16: 

Tabla de Datos : disposición rectangular de las observaciones i

Slide 17: 

T. de D. : « individuos x caract. cuantitativas » T. de D. : « individuos x caract. cualitativas » ¿Para qué construimos las Tablas de Datos? Para evaluar la semejanza entre los individuos comparados por los atributos observados. Para evaluar la asociación entre las caracterís- ticas observadas sobre un conjunto de unidades de observación Según el tipo de atributos y su escala de medida...

Slide 18: 

Matriz de Datos Se asocia a la T. de D. una matriz de orden (n x p)

Slide 19: 

Información de una T. de D. Información = mensaje destinado a comunicar el resultado de una comparación Información elemental = dato... resulta de la comparación de una realidad con una escala o una lista de atributos Comparar un grupo de individuos observados implica producir un “mensaje” Analizar Producir un “mensaje” Observar Comparar Resultados Interpretar el “mensaje”

Slide 20: 

Información estadística: - resumen de las comparaciones hechas con los datos. - estudio de la relaciones que se presentan entre diversas informaciones (constituyen un “hecho”) Componentes y modalidades del mensaje Comparar Mensaje Interpretar el mensaje Modalidades Componentes Modo analógico Modo digital Contenido Sentido

Slide 21: 

Información pertinente Es una información que se ajusta en precisión y sentido al uso que se hará de ella. Información fiable Es una información que comporta una precisión y un sentido estables.

Slide 22: 

La información de las tablas “individuos x var. cuantitativas” Repaso de conceptos conocidos... Observar, conservar las observ. y resumir... Tabla “Ind. x Var. Cuantitativas” medición de cada escala para cada individuo Observación de las características informacion...?

Slide 23: 

Información disponible en una Tabla “Individuos x Var. Cuantitativa” Esa información resulta de... Comparación de los individuos para evaluar las semejanzas... Evaluación del nivel de relación entre las variables...

Slide 24: 

Tabla de Datos “Ind. x Var. Cuantitativas” Resumir perder información

Slide 26: 

Esa manera de resumir la información de la Tabla de Datos... Hace que se pierda la información sobre los individuos... No permite estudiar la información relativa a las variables

Slide 27: 

Estudio de la semejanza entre individuos (variables cuantitativas) Un ejemplo numérico... para fijar las ideas!! Tabla de Datos Ejemplo : ¿cómo comparar el animal 2 y el animal 10?

Slide 28: 

Comunicación de la información... Modo digital Modo analógico 150 cm 60 cm 0 0 Información “precisa” y “fiable”... transmite el contenido de la comparación. Información “precisa”... transmite el sentido de la comparación. Mensajes poco pertinentes... ¿por qué...?

Slide 29: 

Otra manera de transmitir esas comparaciones... 68 Longitud del cuerpo Perímetro del pecho 10 2 Modo analógico

Slide 30: 

Modo digital Vemos que... la expresión digital de la semejanza es mas precisa, pero tiene menos sentido que la expresión analógica el gráfico de dispersión permite comparar simultáneamente todos los animales...

Slide 31: 

Evaluación de la semejanza entre individuos 1. Similaridad Propiedades de la función de similaridad

Slide 32: 

2. disimilaridad La disimilaridad se define mediante un índice complementario del índice de similaridad. Propiedades de la función de disimilaridad

Slide 33: 

distancia Simetría : Desigualdad triangular : Distancia nula :

Slide 34: 

Nota sobre los conceptos de disimilaridad y de distancia no satisface la propiedad de “desigualdad triangular” Un índice de disimilaridad no permite crear un espacio euclidiano de representación En nuestro ejemplo numérico... única representación posible...

Slide 35: 

Definir un espacio de representación capaz de transmitir el sentido de la información disponible en la Tabla de datos. Para producir un “mensaje” pertinente sobre la información de una Tabla de Datos es necesario... Utilizar como criterio de comparación una distancia adecuada en nuestro ejemplo numérico en nuestro ejemplo numérico

Slide 36: 

Evaluación de las distancias Matriz de distancias entre los 10 primeros animales

Slide 37: 

Atención!... para que la representación de la información sea pertinente, debemos emplear una distancia adecuada como criterio de comparación... Ejemplo: la distancia de “city-blocks” 6 4 10 9 7 3 5 2 1 8

Slide 38: 

Estudio de la información de una Tabla de Datos con una sola variable cuantitativa Recordemos las principales técnicas de análisis de las distribuciones univariadas...

Slide 39: 

Ejemplo : Longitud del cuerpo de 22 animales Tabla de Datos Media de la distribución

Slide 40: 

Representación gráfica de la distribución 6 21 4 3 11 5 16 19 18 13 10 8 7 1 2 12 9 22 15 14 17 20 0 Representación física de la media de una distribución 157,4 cm

Slide 41: 

Centro de gravedad de la distribución: Sobre el eje de representación de la nube de puntos...

Slide 42: 

Varianza de la distribución Evalúa la dispersión de los valores observados en torno al valor medio Definición: Desvío estándar de la distribución:

Slide 43: 

Representación física de la varianza de una distribución Eje de giro

Slide 44: 

Varianza e inercia La varianza de una distribución corresponde a la inercia de una nube de puntos con respecto a su Centro de Gravedad. Contribución a la inercia, con respecto al baricentro del individuo i Inercia, con respecto al baricentro, de la nube de puntos

Slide 45: 

La mediana de una distribución 157,5 = mediana 150 = primer cuartil 163 = tercer cuartil

Slide 46: 

Boxplot de la distribución LONGITUD DEL CUERPO DEL ANIMAL

Slide 47: 

Histograma de la distribución LONGITUD DEL CUERPO DEL ANIMAL

Slide 48: 

Variable centrada Ejemplo:

Slide 49: 

Representación gráfica de la variable centrada La media de una variable centrada es nula

Slide 50: 

Variable reducida La reducción neutraliza la influencia de la unidad de medida. La varianza de una variable reducida es igual a 1.

Slide 51: 

Teorema de Huygens G Z

Slide 52: 

Varianza total = suma de varianzas intra-grupos + varianza inter-grupos Teorema de Huygens : en términos de descomposición de la varianza (k grupos)

Slide 53: 

Estudio de la información de una Tabla de Datos con dos variables cuantitativas Recordemos las principales técnicas de análisis de las distribuciones bivariadas…

Slide 54: 

Tabla de Datos: ejemplo G : baricentro de la nube de puntos-individuos. Todos los animales tienen la misma “importancia” en las comparaciones...

Slide 55: 

Representación de la nube de puntos individuos G 17 17 17 17 17 17 17 17 17 17 17 17 17

Slide 56: 

Transformación de las variables... variables centradas Coordenadas del punto i : Ejemplos :

Slide 57: 

Transformación geométrica : translación del origen de los ejes de representación. G 0 10.6 1.5 -7.4 -4.5 0 1 3 Long. cuerpo (centrada) Perim. pecho (centrada)

Slide 58: 

Transformación de las variables... variables centradas y reducidas Coordenadas del punto i : Ejemplo :

Slide 59: 

Transformación geométrica : estandarización de escala en función de la variabilidad observada.

Slide 60: 

Evaluación de la relación entre las dos variables... covarianza y correlación Dos distribuciones bivariadas pueden presentar el mismo baricentro y las mismas inercias marginales... ¿Cómo describir entonces las distribuciones bivariadas?

Slide 61: 

Definición de la covarianza

Slide 62: 

Interpretación geométrica de la covarianza

Slide 63: 

Modelos de dependencia y de independencia relación lineal positiva entre las var. x e y independencia entre las var. x e y relación lineal negativa entre las var. x e y el valor de la covarianza depende de las unidades de medida de las variables que componen la distribución bivariada Pero...

Slide 64: 

Repaso del concepto de correlación La correlación no depende de las unidades de medida de las variables

Slide 65: 

Estudio de la información de una Tabla de Datos con más de dos variables cuantitativas El estudio de las distribuciones p-variadas debe iniciarse con el caso en que p = 3

Slide 66: 

Tabla de Datos (ejemplo) Representación.. de n puntos individuos en el espacio de las k variables. Representación... de k puntos-variables en el espacio de los n individuos.

Slide 67: 

3 O 21

Slide 68: 

Evaluación de la dispersión de una nube de puntos-individuos en R3 de modo que :

Slide 69: 

Representación gráfica de la dispersión de la nube de puntos en R3 3 15 18 ¿cuál es el valor de la inercia de esa nube de puntos...?