Área de concentração: 55137 - Mestrado Profissional em Matemática, Estatística e Computação Aplicadas à Indústria
Criação: 07/12/2016
Nº de créditos: 6
Carga horária:
Teórica Por semana |
Prática Por semana |
Estudos Por semana |
Duração | Total |
3 | 0 | 3 | 15 Semanas | 90 Horas |
Docentes responsáveis:
Alexandre Cláudio Botazzo Delbem
Cláudio Fabiano Motta Toledo
Objetivos:
Introduzir técnicas de mineração de dados avançadas que possibilitam a determinação automática de correlações a partir de qualquer tipo de dado para construção de modelos probabilíticos, que podem ser utilizados para métodos de classificação e para projeto de algoritmos de otimização baseados em modelos.
Justificativa:
O agrupamento de dados é adequado para se verificar semelhanças, correlações ou homologia a partir de dados de diversas áreas, principalmente, em uma área relativamente nova, sem modelos descrevendo o sistema em estudo. Algumas técnicas recentes de mineração de dados têm possibilitado analisar conjuntos de amostras envolvendo tipos de dados considerados complexos, como por exemplo, espectros, sinais, imagens, planilhas, textos, códigos de computador, etc., que podem conter tanto pequena quanto grande quantidade de amostras. A partir de análises geradas por tais técnicas, pode-se contruir modelos probabilíticos descrevendo o sistema em estudo e, então, utilizá-los para tarefas de classificação ou para construção de algoritmos de otimização baseados nesses modelos, que têm sido denominados de Algoritmos de Estimção de Distribuição.
Conteúdo:
Introdução de técnicas de agrupamento e classificação para casos com p<<n, em que p é o número de amostras e n é o número de características de cada amostra. Comparação de amostras baseada em compressão de dados. Mineração de Dados de Repositório de Códigos. Descoberta de novidade baseada em agrupamento por compressão. Análise de agrupamentos hierárquicos: detecção de comunidades, seleção de grupos por fronteira de Pareto e ambiguidade de árvore. Projeto de algoritmos de estimação de distribuição a partir de modelos probabilísticos gerados por mineração de dados complexos. Estudos de casos de aplicações dessas técnicas em problemas de engenharia, binformática, agricultura e logística.
Forma de avaliação:
Provas e projetos
Observação:
Nenhuma.
Bibliografia:
- Hastie, T., Tibshirani, R., Friedman, J.. The Elements of Statistical Learning: Data Mining, Inference, and Prediction, Springer, Second Edition, 2009.
- Newman, M.. Networks: An Introduction, Oxford University Press, 2010.
- Cilibrasi, R., Vitányi, P.. Clustering by compression, IEEE Trans. On Information Theory, vol. 51, No. 4, 2005, 15231545.
- Felsenstein, J.. Inferring phylogenies. : Sinauer Associates, 2003.
© 2024 Instituto de Ciências Matemáticas e de Computação