Incorporação de Múltiplos Representantes Auxiliares em Processos de Detecção de Agrupamentos Semi-supervisionados

Nome do Aluno: 
Local: 
Sala 1B132, Bloco 1B, Campus Santa Mônica
Banca examinadora: 
Prof.ª Dr.ª Maria Camila Nardini Barioni – FACOM/UFU
Prof.ª Dr.ª Sandra Aparecida de Amo – FACOM/UFU
Prof.ª Dr.ª Denise Guliato – FACOM/UFU
Prof.ª Dr.ª Elaine Parros Machado de Sousa – ICMC/USP

A incorporação de semi-supervisão no processo de detecção de agrupamento de dados tem sido especialmente útil quando se deseja obter uma alta consistência entre o particionamento dos dados e o conhecimento do usuário sobre a verdadeira estrutura dos dados. Nos últimos tempos, várias estratégias para detecção de agrupamentos semi-supervisionado de dados têm sido propostas. As abordagens adotadas por essas estratégias têm como objetivo guiar o processo de detecção de grupos por meio do uso de restrições com os seguintes propósitos: interferindo a atribuição das instâncias ao grupo mais apropriado a cada iteração do algoritmo; ou modificando a função objetivo utilizada. Esta dissertação apresenta uma nova abordagem para incorporar semi-supervisão ao amplamente conhecido algoritmo k-means. Esse método de agrupamento semi-supervisionado emprega as informações de restrições na definição de múltiplos representantes auxiliares para os centróides utilizados a cada iteração do k-means e na geração de novos tipos de restrições que agem em nível de protótipo. Um processo de refinamento é desenvolvido para reduzir o número de representantes auxiliares considerados a cada centróide, sem perder a qualidade do agrupamento. Os resultados experimentais mostram o potencial da abordagem proposta para lidar com agrupamentos de diferentes formas, tamanhos e densidades.