Palestras e Seminários

29/05/2023

14:00

Auditório Luiz Antonio Favaro

Palestrante: António Branco

Responsável: Ricardo Marcacini (Este endereço de email está sendo protegido de spambots. Você precisa do JavaScript ativado para vê-lo.)

Modo: Presencial

Salvar atividade no Google Calendar Semantics 2023 - IV Workshop de Representações Semanticamente Enriquecidas

Nesta palestra convidada junto do Grupo de Interessados em Processamento de Linguagem Natural (PLN) e Mineração de Texto da Universidade de S. Paulo, campus de S. Carlos, procurarei trazer alguns resultados recentes do meu grupo de pesquisa com enfoque no tópico de mineração de argumentos e no tema associado relativo ao raciocínio de senso comum. Os enormes avanços obtidos nos últimos anos em virtualmente qualquer tarefa ou aplicação de PLN com métodos de aprendizagem profunda, e em particular com a arquitetura neuronal Transformer e suas variantes, faz sustentar a convicção de que este tipo de modelos tem capacidade de aprender regularidades sem recorrer a bases de conhecimento linguístico para se obter o melhor desempenho em qualquer tarefa da PLN. Apresentarei dois conjuntos de resultados que, na minha perspetiva, ajudam se não contrariar esta convicção, pelo menos a introduzir alguns grãos de sal na apreciação das virtualidades dos modelos neuronais dominantes e possivelmente abrir caminhos para melhorar a nossa compreensão do seu funcionamento. Trazem evidência: de que as bases de conhecimento linguístico são importantes para a melhoria do seu desempenho; e de que a sua aprendizagem sem suporte linguístico passa ao lado de regularidades intrínsecas à tarefa de PLN em questão, colocando em causa o real alcance das generalizações aprendidas. Reportarei, por um lado, resultados que indicam que bases de conhecimento linguístico, infundidas nos modelos através de aprendizagem por transferência, melhoram o desempenho da mineração de argumentos (Rodrigues e Branco, 2022, COLING). Por outro lado, reportarei também resultados que sugerem que, os modelos neuronais não estarão a aprender generalizações intrínsecas da tarefa de raciocínio, mas antes atalhos espúrios que parecem explorar artefactos acidentais nos dados de treino (Branco e Branco, 2021, EMNLP outstanding paper award).

Mini-bio: Prof. António Branco (Universidade de Lisboa) se dedica à Inteligência Artificial e à sua subárea de Processamento de Linguagem Natural, com especial enfoque na preparação tecnológica da língua portuguesa para a era digital. Atua como diretor da Infraestrutura de Pesquisa PORTULAN CLARIN para a Ciência e Tecnologia da Linguagem. Esta infraestrutura multidisciplinar conta com uma rede aberta de mais de 20 organizações e centros de investigação das áreas da Inteligência Artificial, Humanidades Digitais, Engenharia, Linguística e Psicologia entre outras, de Portugal e do Brasil. Pertence à Rede Nacional Portuguesa de Infraestruturas de Investigação de Interesse Estratégico e é o nó nacional da Infraestrutura Europeia CLARIN ERIC, com mais de 20 países membros. Mais detalhes: http://www.di.fc.ul.pt/~ahb/

CONECTE-SE COM A GENTE
 

© 2024 Instituto de Ciências Matemáticas e de Computação