Palestras e Seminários

01/04/2019

10:30

auditório Luiz Antonio Favaro

Palestrante: Marcos V. N. Bedo

Responsável: Agma Juci Machado Traina (Este endereço de email está sendo protegido de spambots. Você precisa do JavaScript ativado para vê-lo.)

Salvar atividade no Google Calendar Palestra

Resumo:

A concentração de distâncias é uma ameaça que permeia a classificação e indexação de dados em espaços de alta dimensionalidade. Métodos de filtragem são capazes de reduzir a dimensionalidade dos dados, ainda que introduzindo um segundo viés à tarefa principal. Nessa apresentação, examinamos o problema de filtragem de outra perspectiva, na qual múltiplos filtros são agregados de acordo com restrições oriundas do método de classificação. Uma solução para o problema é apresentada na forma de uma consulta top-k generalizada sobre múltiplos rankings (k-skyband queries), seguindo o conceito de F-dominância para funções lineares ponderadas e monotônicas. Ao contrário das abordagens existentes, a solução fornece uma estratégia determinística para unir múltiplos filtros, ao mesmo tempo que evita o problema de se resolver empates em consultas top-k. A primeira etapa da modelagem usa medidas orientadas à classificação definidas de acordo com o domínio do problema (e.g., F1-Score) para quantificar a qualidade de cada filtro com relação a um classificador em particular, sendo que intervalos de tolerância são colocados ao redor desses valores iniciais para definir os pesos parciais da busca. Na sequência, a solução aplica uma rotina de busca k-Skyband ótima para selecionar as k dimensões mais relevantes dos rankings agregados de acordo com os intervalos de tolerância. Experimentos em conjuntos de dados reais indicam a qualidade das características selecionadas pela modelagem em dois cenários: (i) análise exploratória sobre valores de k e intervalos de tolerância e (ii) redução de conjuntos de dados para a sua dimensionalidade intrínseca.

CV:
Marcos V. N. Bedo é graduado, mestre e doutor pelo Instituto de Ciências Matemáticas e de Computação (ICMC/USP) de São Carlos/SP. Em 2014 foi o ganhador do prêmio Prof. José Mauro de Castilho do Simpósio Brasileiro de Banco de Dados. Atualmente, é professor do curso de Computação do INFES/UFF e docente do Programa de Pós-graduação em Modelagem Computacional da Escola de Engenharia de Volta Redonda da MCCT/EEIMVR/UFF. Suas áreas de atuação incluem consultas por similaridade, otimização de consultas baseadas em distância e similaridade diversificada.

CONECTE-SE COM A GENTE
 

© 2024 Instituto de Ciências Matemáticas e de Computação