data mining

Views:
 
Category: Education
     
 

Presentation Description

No description available.

Comments

By: itrameshch (99 month(s) ago)

hey its good one how can i download this Saving.....

By: Divyagv (108 month(s) ago)

i want this ppt

By: nikethan.cse (110 month(s) ago)

download this ppt

By: BABASONICO_133 (113 month(s) ago)

Gracias es unos de los mejores archivos bien explicados saludos

Presentation Transcript

Investigación de Mercados : 

1 Investigación de Mercados Profesores : Ricardo Montoya - Rodrigo Niño DATA MINING Basado en apuntes del curso de Data Mining (DII)

Motivaciones para Almacenar Datos : 

2 Motivaciones para Almacenar Datos Razones iniciales: En telecomunicación: Facturación de llamadas Potenciales: En telecomunicación: Detección de fraude En supermercados: Gestión del inventario En bancos: Manejo de cuentas En supermercados: Asociación de ventas En bancos: Segmentación de clientes En empresas de producción: Control de procesos En empresas de producción: Mantención preventivo

Idea básica y potenciales de data mining : 

3 Idea básica y potenciales de data mining Los datos disponibles contienen información importante.

Relevancia de Data Mining : 

4 Relevancia de Data Mining

Proceso de KDD Knowledge Discovery in Databases : 

5 Proceso de KDD Knowledge Discovery in Databases “KDD es el proceso no-trivial de identificar patrones previamente desconocidos, válidos, nuevos, potencialmente útiles y comprensibles dentro de los datos“

Aplicaciones de Data Mining : 

6 Aplicaciones de Data Mining Customer Relationship Management Segmentación de clientes Database Marketing Predicción de compra Retención de clientes Predicción de fuga Detección de Fraude Tarjetas de crédito Uso de teléfonos (celulares) Predicción de series de tiempo

Detección de Fraude : 

7 Detección de Fraude Credicard Brazil, S.A.: Sistema para detección de fraude usando redes neuronales Reducción de fraude por 40% en un año Observación de transacciones de 4.5 millones de tarjetas de Credicard en tiempo real.

Detección de Fraude - ejemplos : 

8 Detección de Fraude - ejemplos CTC Telefónica Chile ISAPRES Pago de Impuestos

Métodos de Data Mining : 

9 Métodos de Data Mining Estadística Agrupamiento (Clustering) Análisis Discriminante Redes Neuronales Árboles de Decisión Reglas de Asociación Bayesian (Belief) Networks Support Vector Machines (SVM)

Base de lógica difusa : 

10 Base de lógica difusa 3 0 3 6 4 2 Edad 1 m ( A ) Función de pertenencia Variable lingüística “Cliente joven”

Agrupamiento con lógica difusa : 

11 Agrupamiento con lógica difusa

Slide 12: 

12 Agrupamiento con Lógica Difusa Algoritmo: Fuzzy c-means (FCM) n objetos, c clases ui,j = grado de pertenencia de objeto i a clase j (i=1, ..., n; j=1, ..., c) U = (ui,j)i,j ui,j [0,1; ui,j = 1; i = 1, ..., n Función objetivo: min  (ui,j)m d2(xi, cj) xi : objeto i; cj : centro de clase j; d2(xi, cj): distancia entre xi y cj m : parámetro difuso (1<m<)

Slide 13: 

13 1. Determina una matriz U con ui,j [0,1; =1 2. Determina los centros de las clases: cj = 3. Actualiza los grados de pertenencia: ui,j = Uk = matriz en iteración k 4. Criterio para detener: Uk+1 - Uk <  Algoritmo: Fuzzy c-means (FCM)

Segmentación de Clientes : 

14 Segmentación de Clientes

Slide 15: 

15 Segmentación de Clientes - Solución Tradicional 3 Clases de clientes privados: Clase 1: Ingreso <= 30,000 DM Propiedades <= 40,000 DM Clase 2: Ingreso > 30,000 DM y <= 80,000 DM Propiedades > 40,000 DM y <= 200,000 DM Clase 3: Ingreso > 80,000 DM Propiedades > 200,000 DM

Segmentación de Clientes : 

16 Segmentación de Clientes Selección de atributos Segmen- tación de clientes Agrupamiento Clasificación

Segmentación de Clientes usando Agrupamiento Difuso : 

17 Segmentación de Clientes usando Agrupamiento Difuso Modelo Objetos: clientes; Atributos: ingreso, edad, propiedades, ... Método Fuzzy c-means con c=2, ..., 10 clases

Centros de 6 Clases : 

18 Centros de 6 Clases

Análisis de Respuesta con Redes Neuronales : 

19 Análisis de Respuesta con Redes Neuronales Datos disponibles:9000 registros de clientes de un sub-segmento, incluyendo: uso de 18 productos datos socio-demográficos y personales datos de respuesta después de un mailing (Aprender de este mailing para el próximo mailing!)

Redes Neuronales : 

20 Redes Neuronales

Slide 21: 

21 Multilayer Perceptron Aplicaciones: Clasificación Regresión Redes Neuronales

Slide 22: 

22 Análisis de Respuesta con Redes Neuronales Multilayer Perceptron Entrada: edad crédito ... Salida: Compra No compra Conexiones con pesos

Análisis de Respuesta con Redes Neuronales : 

23 Análisis de Respuesta con Redes Neuronales maximizar el número de clientes en una selección determinada minimizar el volumen del mailing

Slide 24: 

24 Análisis de Respuesta con Redes Neuronales

Slide 25: 

25 Análisis de Respuesta con Redes Neuronales

Slide 26: 

26 Análisis de Respuesta con Redes Neuronales - Resultados Tasa de respuesta Antes: Después: 7-9% 17-20%

Reglas de Asociación : 

27 Reglas de Asociación Ejemplo: Tenemos un base de datos con transacciones de venta en un Supermercado. ¿Qué productos se compran juntos? “Venta de cerveza y pañales” Proceso: Busca reglas para concluir la venta de un producto a partir de la venta del otro.

Reglas de Asociación - Definiciones 1 : 

28 Reglas de Asociación - Definiciones 1 “Confidence”: La regla X ==>Y tiene “confidence” c si c% de las transacciones en T con X también contienen Y. Ejemplo: Productos : {1, 2, 3, 4, 5} Transacciones : T = {(1, 3, 4), (2, 3, 5), (1, 2, 3, 5), (2, 5)} (2, 3) ==> (5) tiene “confidence” 100% (2 de 2 transacciones que contienen (2, 3) también contienen (5))

Reglas de Asociación - Definiciones 2 : 

29 Reglas de Asociación - Definiciones 2 “Support”: La regla X==>Y tiene “support” s en el conjunto de transacciones D si s% de las transacciones en T contienen (X e Y). Ejemplo: Productos : {1, 2, 3, 4, 5} Transacciones : T = {(1, 3, 4), (2, 3, 5), (1, 2, 3, 5), (2, 5)} (2, 3) ==> (5) tiene “support” 50% (2 de 4 transacciones de T contienen (2, 3, 5))

Caso: Supermercado : 

30 Dick’s Supermarket: cadena de supermercados en EE.UU. ... utiliza herramientas de data mining para extraer información acerca del historial de compra de sus clientes. 90% de las ventas son capturadas por tarjetas de registro Data mining encontró relaciones entre productos y patrones de compras de los clientes (por ejemplo: se venden yoghurt y barras de granola juntos). Estante con ambos productos aumenta ventas por 60% Caso: Supermercado

Experiencias del Caso Supermercado : 

31 Importante: Adquisición de datos (tarjetas de registro) Programas de incentivos para el uso de las tarjetas Datos contienen información relaciones entre productos patrones de compras de los clientes 45% de los consumidores representan 90% de todas las ventas Alto beneficio de data mining aumento de las ventas: 60% Experiencias del Caso Supermercado

Reglas de Asociación para Web Mining : 

32 Reglas de Asociación para Web Mining Asociación entre páginas web

Principales áreas de aplicación de Web Usage Mining : 

33 Principales áreas de aplicación de Web Usage Mining Fuente: www.webmining.cl

Reglas de Asociación para Web Usage Mining : 

34 Reglas de Asociación para Web Usage Mining s = 0.01, c = 0.75 /compania/productos/, /compania/productos/producto1.html}  /compania/productos/producto2.html 75% de los clientes que accesan la sección de productos y visitan producto1.html, también visitan producto2.html, y la combinación de estos eventos ocurre en el 1% de las sesiones. Fuente: www.webmining.cl

Métodos de Data Mining : 

35 Métodos de Data Mining CHAID / CART Clasificador de Bayes Redes neuronales sin supervisión: Self-organizing feature maps de Kohonen Support Vector Machines

authorStream Live Help