[QUALIFICAÇÃO DE DOUTORADO] Uma Nova Abordagem de Aprendizagem de Máquina Combinando Elicitação Automática de Casos e Aprendizagem por Reforço. Aplicação a Agentes Jogadores de Damas

Nome do Aluno: 
Local: 
Sala 1B132, Bloco 1B. Horário: 9h
Banca examinadora: 
Prof.ª Dr.ª Rita Maria da Silva Julia (orientadora) - FACOM/UFU
Prof. Dr. Marcelo Keese Albertini - FACOM/UFU
Prof. Dr. Estevam Rafael Hruschka Júnior - DC/UFSCAR

Este trabalho propõe um sistema automático jogador de Damas híbrido que combina as técnicas de aprendizagem de máquina Elicitação Automática de Casos (um tipo particular de Raciocínio Baseado em Casos) e Aprendizagem por Reforço: o ACE-RL-Checkers. Tal combinação provê as seguintes contribuições: aprimora a exploração randômica realizada pelos agentes baseados em Elicitação Automática de Casos e introduz adaptabilidade de tomada de decisão nos agentes baseados em Aprendizagem por Reforço. Nesta direção, com o objetivo de cumprir tal proposta, três etapas são traçadas pela presente pesquisa: primeiramente, propor e implementar uma eficiente plataforma jogadora de Damas baseada apenas em Aprendizagem por Reforço: o LS-VisionDraughts. Tal agente se constitui de uma Rede Neural de Perceptron Multicamadas jogadora de Damas treinada pelo mé- todo de Aprendizagem por Reforço TD(); na sequência, como segunda etapa, reproduzir a arquitetura jogadora de Damas baseada apenas na Elicitação Automática de Casos: o CHEBR proposto por Powell. Tal agente faz uso de uma abordagem probabilística que realiza exploração randômica no espaço de busca com o objetivo de aprender a jogar Damas automaticamente; por fim, a última etapa propõe a implementação de uma arquitetura híbrida que, combinando Aprendizagem por Reforço e Elicitação Automática de Casos, agrega as habilidades de ambas as abordagens, ao mesmo tempo em que elimina as suas fragilidades: o ACE-RL-Checkers. Os resultados obtidos até o presente momento com a conclusão das duas primeiras etapas e com a execução parcial da terceira etapa, confirmam que a nova abordagem híbrida de Aprendizagem de Máquina proposta é bastante promissora, uma vez que o desempenho em torneios dos agentes implementados de acordo com ela mostrou-se bastante superior quando comparada a de seus adversários baseados unicamente em Aprendizagem por Reforço e Elicitação Automática de Casos.