[DISSERTAÇÃO DE MESTRADO] Descoberta de Exploits Usando Dados da Rede Social Twitter

Nome do Aluno: 
Local: 
Defesa realizada através de vídeo conferência
Data de Defesa: 
28/08/2020 - 09:00
Banca examinadora: 
Rodrigo Sanches Miani - FACOM/UFU(orientador)
Elaine Ribeiro de Faria Paiva - FACOM/UFU(coorientadora)
Rafael Pasquini - FACOM/UFU
Sylvio Barbon Júnior - DC/UEL

 

No gerenciamento de segurança da informação, um aspecto crucial é a instalação decorreções para vulnerabilidades de softwares. O crescente número dessas vulnerabilidades,associado à necessidade de análise dos impactos de cada atualização, podem fazer com queadministradores adiem atualizações e deixem seus sistemas vulneráveis por muito tempo.Além disso, estudos relacionados apontam que muitas vulnerabilidades são exploradasapenas em provas de conceito, tornando a identificação de ameaças reais ainda maisdifícil.  Uma técnica que ajude a detectar quais vulnerabilidades possuemexploitsnomundo real pode ser uma ferramenta poderosa para ajudar administradores de sistemas.Para agilizar essas detecções, o uso de aprendizado de máquinas aplicado a discussõesem redes sociais tem se mostrado promissor. Nesta dissertação são aplicadas técnicas deaprendizado de máquina a dados de discussões no Twitter e bases de dados públicas paradeterminar se uma vulnerabilidade foi ou não explorada.  O trabalho também analisao comportamento de diferentes algoritmos de classificação, investiga a influência do usode rótulos verdadeiros extraídos de diferentes empresas de antivírus e experimenta comtreino em vários tamanhos de janelas temporais. As descobertas deste trabalho sugeremque o uso doensemble Light Gradient Boosting Machine(LightGBM) e do algoritmo debalanceamento de classesAll k-Nearest-Neighbor(AllKNN) pode beneficiar os resultadosem termos deF-scoree precisão.  O trabalho ainda demonstra como o uso de rótulosextraídos de uma única empresa de antivírus pode enviesar o modelo.No gerenciamento de segurança da informação, um aspecto crucial é a instalação decorreções para vulnerabilidades de softwares. O crescente número dessas vulnerabilidades,associado à necessidade de análise dos impactos de cada atualização, podem fazer com queadministradores adiem atualizações e deixem seus sistemas vulneráveis por muito tempo.Além disso, estudos relacionados apontam que muitas vulnerabilidades são exploradasapenas em provas de conceito, tornando a identificação de ameaças reais ainda maisdifícil. Uma técnica que ajude a detectar quais vulnerabilidades possuemexploitsnomundo real pode ser uma ferramenta poderosa para ajudar administradores de sistemas.Para agilizar essas detecções, o uso de aprendizado de máquinas aplicado a discussõesem redes sociais tem se mostrado promissor. Nesta dissertação são aplicadas técnicas deaprendizado de máquina a dados de discussões no Twitter e bases de dados públicas paradeterminar se uma vulnerabilidade foi ou não explorada. O trabalho também analisao comportamento de diferentes algoritmos de classificação, investiga a influência do usode rótulos verdadeiros extraídos de diferentes empresas de antivírus e experimenta comtreino em vários tamanhos de janelas temporais. As descobertas deste trabalho sugeremque o uso doensemble Light Gradient Boosting Machine(LightGBM) e do algoritmo debalanceamento de classesAll k-Nearest-Neighbor(AllKNN) pode beneficiar os resultadosem termos deF-scoree precisão. O trabalho ainda demonstra como o uso de rótulosextraídos de uma única empresa de antivírus pode enviesar o modelo