3 ModelagemEstatistica

Uploaded from authorPOINTLite
Views:
 
Category: Entertainment
     
 

Presentation Description

No description available.

Comments

Presentation Transcript

NaïveBayes: 

NaïveBayes Na modelagem estatística, todos os atributos são considerados igualmente importantes e independentes um do outro, dada uma classe Apesar desta suposição irrealista, ela conduz a um esquema bastante simples, com resultados surpreendentemente bons A idéia é contar quantas vezes cada par atributo-valor ocorre com cada valor do atributo-classe Este método simples e intuitivo é baseado na Regra de Bayes, de probabilidade condicional

Slide3: 

Usaremos o problema do tempo, como exemplo

Slide6: 

A idéia de um programa Oráculo, ou Preditor, baseado em estatísticas de Bayes

Slide8: 

Probabilidade de ter jogo (tem_jogo = 'sim') 2/9 x 3/9 x 3/9 x 3/9 x 9/14 = 0.0053 Probabilidade de não ter jogo (tem_jogo = 'não') 3/5 x 1/5 x 4/5 x 3/5 x 5/14 = 0.0206 Conclusão: para o dia previsto  ensolarado, frio, ventoso e com umidade alta  é aproximadamente quatro vezes mais provável que não haja jogo

Slide9: 

Probabilidades em percentagem P[sim] = 0.0053 / (0.0053 + 0.0206) = 20.5% P[não] = 0.0206 / (0.0053 + 0.0206) = 79.5%

Exercício Individual: 

Exercício Individual Biblioteca WEKA Muitos arquivos de dados Técnicas de fragmentação: “Holdout” e “Cross Validation” Algoritmos: 1R, Id3, J48, Prism, NaïveBayes Para um arquivo de dados ‘Rode’ os 6 processos Entenda os resultados Procure, na wikipedia, o significado de Algumas estatísticas (Kappa, ...) Matriz de confusão Qual o melhor processo? Documente tudo, e entregue Prazo: 30/10