Slide3:
Usaremos o problema do tempo, como exemplo
Slide6:
A idéia de um programa Oráculo, ou Preditor, baseado em estatísticas de Bayes
Slide8:
Probabilidade de ter jogo (tem_jogo = 'sim')
2/9 x 3/9 x 3/9 x 3/9 x 9/14 = 0.0053
Probabilidade de não ter jogo (tem_jogo = 'não')
3/5 x 1/5 x 4/5 x 3/5 x 5/14 = 0.0206
Conclusão: para o dia previsto ensolarado, frio, ventoso e com umidade alta é aproximadamente quatro vezes mais provável que não haja jogo
Slide9:
Probabilidades em percentagem
P[sim] = 0.0053 / (0.0053 + 0.0206) = 20.5%
P[não] = 0.0206 / (0.0053 + 0.0206) = 79.5%
Exercício Individual:
Exercício Individual Biblioteca WEKA
Muitos arquivos de dados
Técnicas de fragmentação: “Holdout” e “Cross Validation”
Algoritmos: 1R, Id3, J48, Prism, NaïveBayes
Para um arquivo de dados
‘Rode’ os 6 processos
Entenda os resultados
Procure, na wikipedia, o significado de
Algumas estatísticas (Kappa, ...)
Matriz de confusão
Qual o melhor processo?
Documente tudo, e entregue
Prazo: 30/10