logging in or signing up data mining lugqv Download Post to : URL : Related Presentations : Share Add to Flag Embed Email Send to Blogs and Networks Add to Channel Uploaded from authorPOINT lite Insert YouTube videos in PowerPont slides with aS Desktop Copy embed code: (To copy code, click on the text box) Embed: URL: Thumbnail: WordPress Embed Customize Embed The presentation is successfully added In Your Favorites. Views: 1009 Category: Education License: All Rights Reserved Like it (1) Dislike it (0) Added: May 14, 2010 This Presentation is Public Favorites: 0 Presentation Description No description available. Comments Posting comment... By: itrameshch (11 month(s) ago) hey its good one how can i download this Saving..... Saving..... Post Reply Close Saving..... Edit Comment Close By: Divyagv (19 month(s) ago) i want this ppt Saving..... Post Reply Close Saving..... Edit Comment Close By: nikethan.cse (21 month(s) ago) download this ppt Saving..... Post Reply Close Saving..... Edit Comment Close By: BABASONICO_133 (24 month(s) ago) Gracias es unos de los mejores archivos bien explicados saludos Saving..... Post Reply Close Saving..... Edit Comment Close Premium member Presentation Transcript Investigación de Mercados : 1 Investigación de Mercados Profesores : Ricardo Montoya - Rodrigo Niño DATA MINING Basado en apuntes del curso de Data Mining (DII) Motivaciones para Almacenar Datos : 2 Motivaciones para Almacenar Datos Razones iniciales: En telecomunicación: Facturación de llamadas Potenciales: En telecomunicación: Detección de fraude En supermercados: Gestión del inventario En bancos: Manejo de cuentas En supermercados: Asociación de ventas En bancos: Segmentación de clientes En empresas de producción: Control de procesos En empresas de producción: Mantención preventivo Idea básica y potenciales de data mining : 3 Idea básica y potenciales de data mining Los datos disponibles contienen información importante. Relevancia de Data Mining : 4 Relevancia de Data Mining Proceso de KDD Knowledge Discovery in Databases : 5 Proceso de KDD Knowledge Discovery in Databases “KDD es el proceso no-trivial de identificar patrones previamente desconocidos, válidos, nuevos, potencialmente útiles y comprensibles dentro de los datos“ Aplicaciones de Data Mining : 6 Aplicaciones de Data Mining Customer Relationship Management Segmentación de clientes Database Marketing Predicción de compra Retención de clientes Predicción de fuga Detección de Fraude Tarjetas de crédito Uso de teléfonos (celulares) Predicción de series de tiempo Detección de Fraude : 7 Detección de Fraude Credicard Brazil, S.A.: Sistema para detección de fraude usando redes neuronales Reducción de fraude por 40% en un año Observación de transacciones de 4.5 millones de tarjetas de Credicard en tiempo real. Detección de Fraude - ejemplos : 8 Detección de Fraude - ejemplos CTC Telefónica Chile ISAPRES Pago de Impuestos Métodos de Data Mining : 9 Métodos de Data Mining Estadística Agrupamiento (Clustering) Análisis Discriminante Redes Neuronales Árboles de Decisión Reglas de Asociación Bayesian (Belief) Networks Support Vector Machines (SVM) Base de lógica difusa : 10 Base de lógica difusa 3 0 3 6 4 2 Edad 1 m ( A ) Función de pertenencia Variable lingüística “Cliente joven” Agrupamiento con lógica difusa : 11 Agrupamiento con lógica difusa Slide 12: 12 Agrupamiento con Lógica Difusa Algoritmo: Fuzzy c-means (FCM) n objetos, c clases ui,j = grado de pertenencia de objeto i a clase j (i=1, ..., n; j=1, ..., c) U = (ui,j)i,j ui,j [0,1; ui,j = 1; i = 1, ..., n Función objetivo: min (ui,j)m d2(xi, cj) xi : objeto i; cj : centro de clase j; d2(xi, cj): distancia entre xi y cj m : parámetro difuso (1<m<) Slide 13: 13 1. Determina una matriz U con ui,j [0,1; =1 2. Determina los centros de las clases: cj = 3. Actualiza los grados de pertenencia: ui,j = Uk = matriz en iteración k 4. Criterio para detener: Uk+1 - Uk < Algoritmo: Fuzzy c-means (FCM) Segmentación de Clientes : 14 Segmentación de Clientes Slide 15: 15 Segmentación de Clientes - Solución Tradicional 3 Clases de clientes privados: Clase 1: Ingreso <= 30,000 DM Propiedades <= 40,000 DM Clase 2: Ingreso > 30,000 DM y <= 80,000 DM Propiedades > 40,000 DM y <= 200,000 DM Clase 3: Ingreso > 80,000 DM Propiedades > 200,000 DM Segmentación de Clientes : 16 Segmentación de Clientes Selección de atributos Segmen- tación de clientes Agrupamiento Clasificación Segmentación de Clientes usando Agrupamiento Difuso : 17 Segmentación de Clientes usando Agrupamiento Difuso Modelo Objetos: clientes; Atributos: ingreso, edad, propiedades, ... Método Fuzzy c-means con c=2, ..., 10 clases Centros de 6 Clases : 18 Centros de 6 Clases Análisis de Respuesta con Redes Neuronales : 19 Análisis de Respuesta con Redes Neuronales Datos disponibles:9000 registros de clientes de un sub-segmento, incluyendo: uso de 18 productos datos socio-demográficos y personales datos de respuesta después de un mailing (Aprender de este mailing para el próximo mailing!) Redes Neuronales : 20 Redes Neuronales Slide 21: 21 Multilayer Perceptron Aplicaciones: Clasificación Regresión Redes Neuronales Slide 22: 22 Análisis de Respuesta con Redes Neuronales Multilayer Perceptron Entrada: edad crédito ... Salida: Compra No compra Conexiones con pesos Análisis de Respuesta con Redes Neuronales : 23 Análisis de Respuesta con Redes Neuronales maximizar el número de clientes en una selección determinada minimizar el volumen del mailing Slide 24: 24 Análisis de Respuesta con Redes Neuronales Slide 25: 25 Análisis de Respuesta con Redes Neuronales Slide 26: 26 Análisis de Respuesta con Redes Neuronales - Resultados Tasa de respuesta Antes: Después: 7-9% 17-20% Reglas de Asociación : 27 Reglas de Asociación Ejemplo: Tenemos un base de datos con transacciones de venta en un Supermercado. ¿Qué productos se compran juntos? “Venta de cerveza y pañales” Proceso: Busca reglas para concluir la venta de un producto a partir de la venta del otro. Reglas de Asociación - Definiciones 1 : 28 Reglas de Asociación - Definiciones 1 “Confidence”: La regla X ==>Y tiene “confidence” c si c% de las transacciones en T con X también contienen Y. Ejemplo: Productos : {1, 2, 3, 4, 5} Transacciones : T = {(1, 3, 4), (2, 3, 5), (1, 2, 3, 5), (2, 5)} (2, 3) ==> (5) tiene “confidence” 100% (2 de 2 transacciones que contienen (2, 3) también contienen (5)) Reglas de Asociación - Definiciones 2 : 29 Reglas de Asociación - Definiciones 2 “Support”: La regla X==>Y tiene “support” s en el conjunto de transacciones D si s% de las transacciones en T contienen (X e Y). Ejemplo: Productos : {1, 2, 3, 4, 5} Transacciones : T = {(1, 3, 4), (2, 3, 5), (1, 2, 3, 5), (2, 5)} (2, 3) ==> (5) tiene “support” 50% (2 de 4 transacciones de T contienen (2, 3, 5)) Caso: Supermercado : 30 Dick’s Supermarket: cadena de supermercados en EE.UU. ... utiliza herramientas de data mining para extraer información acerca del historial de compra de sus clientes. 90% de las ventas son capturadas por tarjetas de registro Data mining encontró relaciones entre productos y patrones de compras de los clientes (por ejemplo: se venden yoghurt y barras de granola juntos). Estante con ambos productos aumenta ventas por 60% Caso: Supermercado Experiencias del Caso Supermercado : 31 Importante: Adquisición de datos (tarjetas de registro) Programas de incentivos para el uso de las tarjetas Datos contienen información relaciones entre productos patrones de compras de los clientes 45% de los consumidores representan 90% de todas las ventas Alto beneficio de data mining aumento de las ventas: 60% Experiencias del Caso Supermercado Reglas de Asociación para Web Mining : 32 Reglas de Asociación para Web Mining Asociación entre páginas web Principales áreas de aplicación de Web Usage Mining : 33 Principales áreas de aplicación de Web Usage Mining Fuente: www.webmining.cl Reglas de Asociación para Web Usage Mining : 34 Reglas de Asociación para Web Usage Mining s = 0.01, c = 0.75 /compania/productos/, /compania/productos/producto1.html} /compania/productos/producto2.html 75% de los clientes que accesan la sección de productos y visitan producto1.html, también visitan producto2.html, y la combinación de estos eventos ocurre en el 1% de las sesiones. Fuente: www.webmining.cl Métodos de Data Mining : 35 Métodos de Data Mining CHAID / CART Clasificador de Bayes Redes neuronales sin supervisión: Self-organizing feature maps de Kohonen Support Vector Machines You do not have the permission to view this presentation. In order to view it, please contact the author of the presentation.
data mining lugqv Download Post to : URL : Related Presentations : Share Add to Flag Embed Email Send to Blogs and Networks Add to Channel Uploaded from authorPOINT lite Insert YouTube videos in PowerPont slides with aS Desktop Copy embed code: (To copy code, click on the text box) Embed: URL: Thumbnail: WordPress Embed Customize Embed The presentation is successfully added In Your Favorites. Views: 1009 Category: Education License: All Rights Reserved Like it (1) Dislike it (0) Added: May 14, 2010 This Presentation is Public Favorites: 0 Presentation Description No description available. Comments Posting comment... By: itrameshch (11 month(s) ago) hey its good one how can i download this Saving..... Saving..... Post Reply Close Saving..... Edit Comment Close By: Divyagv (19 month(s) ago) i want this ppt Saving..... Post Reply Close Saving..... Edit Comment Close By: nikethan.cse (21 month(s) ago) download this ppt Saving..... Post Reply Close Saving..... Edit Comment Close By: BABASONICO_133 (24 month(s) ago) Gracias es unos de los mejores archivos bien explicados saludos Saving..... Post Reply Close Saving..... Edit Comment Close Premium member Presentation Transcript Investigación de Mercados : 1 Investigación de Mercados Profesores : Ricardo Montoya - Rodrigo Niño DATA MINING Basado en apuntes del curso de Data Mining (DII) Motivaciones para Almacenar Datos : 2 Motivaciones para Almacenar Datos Razones iniciales: En telecomunicación: Facturación de llamadas Potenciales: En telecomunicación: Detección de fraude En supermercados: Gestión del inventario En bancos: Manejo de cuentas En supermercados: Asociación de ventas En bancos: Segmentación de clientes En empresas de producción: Control de procesos En empresas de producción: Mantención preventivo Idea básica y potenciales de data mining : 3 Idea básica y potenciales de data mining Los datos disponibles contienen información importante. Relevancia de Data Mining : 4 Relevancia de Data Mining Proceso de KDD Knowledge Discovery in Databases : 5 Proceso de KDD Knowledge Discovery in Databases “KDD es el proceso no-trivial de identificar patrones previamente desconocidos, válidos, nuevos, potencialmente útiles y comprensibles dentro de los datos“ Aplicaciones de Data Mining : 6 Aplicaciones de Data Mining Customer Relationship Management Segmentación de clientes Database Marketing Predicción de compra Retención de clientes Predicción de fuga Detección de Fraude Tarjetas de crédito Uso de teléfonos (celulares) Predicción de series de tiempo Detección de Fraude : 7 Detección de Fraude Credicard Brazil, S.A.: Sistema para detección de fraude usando redes neuronales Reducción de fraude por 40% en un año Observación de transacciones de 4.5 millones de tarjetas de Credicard en tiempo real. Detección de Fraude - ejemplos : 8 Detección de Fraude - ejemplos CTC Telefónica Chile ISAPRES Pago de Impuestos Métodos de Data Mining : 9 Métodos de Data Mining Estadística Agrupamiento (Clustering) Análisis Discriminante Redes Neuronales Árboles de Decisión Reglas de Asociación Bayesian (Belief) Networks Support Vector Machines (SVM) Base de lógica difusa : 10 Base de lógica difusa 3 0 3 6 4 2 Edad 1 m ( A ) Función de pertenencia Variable lingüística “Cliente joven” Agrupamiento con lógica difusa : 11 Agrupamiento con lógica difusa Slide 12: 12 Agrupamiento con Lógica Difusa Algoritmo: Fuzzy c-means (FCM) n objetos, c clases ui,j = grado de pertenencia de objeto i a clase j (i=1, ..., n; j=1, ..., c) U = (ui,j)i,j ui,j [0,1; ui,j = 1; i = 1, ..., n Función objetivo: min (ui,j)m d2(xi, cj) xi : objeto i; cj : centro de clase j; d2(xi, cj): distancia entre xi y cj m : parámetro difuso (1<m<) Slide 13: 13 1. Determina una matriz U con ui,j [0,1; =1 2. Determina los centros de las clases: cj = 3. Actualiza los grados de pertenencia: ui,j = Uk = matriz en iteración k 4. Criterio para detener: Uk+1 - Uk < Algoritmo: Fuzzy c-means (FCM) Segmentación de Clientes : 14 Segmentación de Clientes Slide 15: 15 Segmentación de Clientes - Solución Tradicional 3 Clases de clientes privados: Clase 1: Ingreso <= 30,000 DM Propiedades <= 40,000 DM Clase 2: Ingreso > 30,000 DM y <= 80,000 DM Propiedades > 40,000 DM y <= 200,000 DM Clase 3: Ingreso > 80,000 DM Propiedades > 200,000 DM Segmentación de Clientes : 16 Segmentación de Clientes Selección de atributos Segmen- tación de clientes Agrupamiento Clasificación Segmentación de Clientes usando Agrupamiento Difuso : 17 Segmentación de Clientes usando Agrupamiento Difuso Modelo Objetos: clientes; Atributos: ingreso, edad, propiedades, ... Método Fuzzy c-means con c=2, ..., 10 clases Centros de 6 Clases : 18 Centros de 6 Clases Análisis de Respuesta con Redes Neuronales : 19 Análisis de Respuesta con Redes Neuronales Datos disponibles:9000 registros de clientes de un sub-segmento, incluyendo: uso de 18 productos datos socio-demográficos y personales datos de respuesta después de un mailing (Aprender de este mailing para el próximo mailing!) Redes Neuronales : 20 Redes Neuronales Slide 21: 21 Multilayer Perceptron Aplicaciones: Clasificación Regresión Redes Neuronales Slide 22: 22 Análisis de Respuesta con Redes Neuronales Multilayer Perceptron Entrada: edad crédito ... Salida: Compra No compra Conexiones con pesos Análisis de Respuesta con Redes Neuronales : 23 Análisis de Respuesta con Redes Neuronales maximizar el número de clientes en una selección determinada minimizar el volumen del mailing Slide 24: 24 Análisis de Respuesta con Redes Neuronales Slide 25: 25 Análisis de Respuesta con Redes Neuronales Slide 26: 26 Análisis de Respuesta con Redes Neuronales - Resultados Tasa de respuesta Antes: Después: 7-9% 17-20% Reglas de Asociación : 27 Reglas de Asociación Ejemplo: Tenemos un base de datos con transacciones de venta en un Supermercado. ¿Qué productos se compran juntos? “Venta de cerveza y pañales” Proceso: Busca reglas para concluir la venta de un producto a partir de la venta del otro. Reglas de Asociación - Definiciones 1 : 28 Reglas de Asociación - Definiciones 1 “Confidence”: La regla X ==>Y tiene “confidence” c si c% de las transacciones en T con X también contienen Y. Ejemplo: Productos : {1, 2, 3, 4, 5} Transacciones : T = {(1, 3, 4), (2, 3, 5), (1, 2, 3, 5), (2, 5)} (2, 3) ==> (5) tiene “confidence” 100% (2 de 2 transacciones que contienen (2, 3) también contienen (5)) Reglas de Asociación - Definiciones 2 : 29 Reglas de Asociación - Definiciones 2 “Support”: La regla X==>Y tiene “support” s en el conjunto de transacciones D si s% de las transacciones en T contienen (X e Y). Ejemplo: Productos : {1, 2, 3, 4, 5} Transacciones : T = {(1, 3, 4), (2, 3, 5), (1, 2, 3, 5), (2, 5)} (2, 3) ==> (5) tiene “support” 50% (2 de 4 transacciones de T contienen (2, 3, 5)) Caso: Supermercado : 30 Dick’s Supermarket: cadena de supermercados en EE.UU. ... utiliza herramientas de data mining para extraer información acerca del historial de compra de sus clientes. 90% de las ventas son capturadas por tarjetas de registro Data mining encontró relaciones entre productos y patrones de compras de los clientes (por ejemplo: se venden yoghurt y barras de granola juntos). Estante con ambos productos aumenta ventas por 60% Caso: Supermercado Experiencias del Caso Supermercado : 31 Importante: Adquisición de datos (tarjetas de registro) Programas de incentivos para el uso de las tarjetas Datos contienen información relaciones entre productos patrones de compras de los clientes 45% de los consumidores representan 90% de todas las ventas Alto beneficio de data mining aumento de las ventas: 60% Experiencias del Caso Supermercado Reglas de Asociación para Web Mining : 32 Reglas de Asociación para Web Mining Asociación entre páginas web Principales áreas de aplicación de Web Usage Mining : 33 Principales áreas de aplicación de Web Usage Mining Fuente: www.webmining.cl Reglas de Asociación para Web Usage Mining : 34 Reglas de Asociación para Web Usage Mining s = 0.01, c = 0.75 /compania/productos/, /compania/productos/producto1.html} /compania/productos/producto2.html 75% de los clientes que accesan la sección de productos y visitan producto1.html, también visitan producto2.html, y la combinación de estos eventos ocurre en el 1% de las sesiones. Fuente: www.webmining.cl Métodos de Data Mining : 35 Métodos de Data Mining CHAID / CART Clasificador de Bayes Redes neuronales sin supervisión: Self-organizing feature maps de Kohonen Support Vector Machines