[DISSERTAÇÃO DE MESTRADO] Aprendizado de Ranking de Entidades Aplicado aos Dados do Governo Brasileiro

Local: 
Por videoconferência
Data de Defesa: 
03/12/2020 - 09:00
Banca examinadora: 
Prof. Dr. Marcelo Keese Albertini - FACOM/UFU (Orientador)
Prof. Dr. Marcelo de Almeida Maia - FACOM/UFU
Prof. Dr. Ricardo Araújo Rios - UFBA

Com o crescimento da quantidade de informações referente à transparência governamental disponíveis nos últimos anos devido as exigências legislativas, o acesso à informação desejada torna-se cada vez mais difícil. Buscadores tradicionais como Google, Yahoo e Bing retornam os documentos ordenados pela relevância perante a consulta informada. A área cujo objetivo é retornar os documentos relevantes é conhecida como Recuperação de Informação à qual pode ser auxiliada por algoritmos de aprendizado de máquina para melhorar a ordenação dos documentos, denominada nesse contexto como Aprendizado de Ranking. Existem na literatura diversos algoritmos para resolver problemas de Aprendizado de Ranking, onde cada um busca resolver o problema de ordenação da melhor forma possível. No contexto de documentos governamentais observa-se a possibilidade de identificar quais são as principais entidades presentes nos documentos mais relevantes retornados em uma determinada consulta. Essa dissertação visou obter uma ordenação dos documentos disponíveis no Porta de Dados do Governo Brasileiro utilizando Aprendizado de Ranking e extrair informação de entidades de bases de dados não-estruturadas, semi-estruturas e tabulares, que são comuns entre as fontes disponibilizadas no Portal. Para atingir tal objetivo recorreremos às técnicas disponíveis no estado da arte para reconhecimento de entidade nomeadas e utilizaremos técnicas de otimização convexa para modelar o processo de aprendizado de ranking. Os resultados obtidos demonstraram-se superiores aos buscadores disponíveis no mercado (Google, Yahoo e Bing) visto que esses indexam somente o resumo dos conjuntos de dados do Portal de Dados.