Área de concentração: 55137 - Mestrado Profissional em Matemática, Estatística e Computação Aplicadas à Indústria

Criação: 07/12/2016

Nº de créditos: 6

Carga horária:

Teórica
Por semana
Prática
Por semana
Estudos
Por semana
Duração Total
3 0 3 15 Semanas 90 Horas

Docentes responsáveis:

Alexandre Cláudio Botazzo Delbem
Cláudio Fabiano Motta Toledo


Objetivos:

Introduzir técnicas de mineração de dados avançadas que possibilitam a determinação automática de correlações a partir de qualquer tipo de dado para construção de modelos probabilíticos, que podem ser utilizados para métodos de classificação e para projeto de algoritmos de otimização baseados em modelos.


Justificativa:

O agrupamento de dados é adequado para se verificar semelhanças, correlações ou homologia a partir de dados de diversas áreas, principalmente, em uma área relativamente nova, sem modelos descrevendo o sistema em estudo. Algumas técnicas recentes de mineração de dados têm possibilitado analisar conjuntos de amostras envolvendo tipos de dados considerados complexos, como por exemplo, espectros, sinais, imagens, planilhas, textos, códigos de computador, etc., que podem conter tanto pequena quanto grande quantidade de amostras. A partir de análises geradas por tais técnicas, pode-se contruir modelos probabilíticos descrevendo o sistema em estudo e, então, utilizá-los para tarefas de classificação ou para construção de algoritmos de otimização baseados nesses modelos, que têm sido denominados de Algoritmos de Estimção de Distribuição.


Conteúdo:

Introdução de técnicas de agrupamento e classificação para casos com p<<n, em que p é o número de amostras e n é o número de características de cada amostra. Comparação de amostras baseada em compressão de dados. Mineração de Dados de Repositório de Códigos. Descoberta de novidade baseada em agrupamento por compressão. Análise de agrupamentos hierárquicos: detecção de comunidades, seleção de grupos por fronteira de Pareto e ambiguidade de árvore. Projeto de algoritmos de estimação de distribuição a partir de modelos probabilísticos gerados por mineração de dados complexos. Estudos de casos de aplicações dessas técnicas em problemas de engenharia, binformática, agricultura e logística.


Forma de avaliação:

Provas e projetos


Observação:

Nenhuma.


Bibliografia:

- Hastie, T., Tibshirani, R., Friedman, J.. The Elements of Statistical Learning: Data Mining, Inference, and Prediction, Springer, Second Edition, 2009.

- Newman, M.. Networks: An Introduction, Oxford University Press, 2010.

- Cilibrasi, R., Vitányi, P.. Clustering by compression, IEEE Trans. On Information Theory, vol. 51, No. 4, 2005, 1523–1545.

- Felsenstein, J.. Inferring phylogenies. : Sinauer Associates, 2003.

CONECTE-SE COM A GENTE
 

© 2024 Instituto de Ciências Matemáticas e de Computação