[DISSERTAÇÃO DE MESTRADO] GENPPI: Um Software Autônomo Para Predição Ab Initio de Redes de Interação Entre Proteínas Bacterianas

Local: 
Por videoconferência
Data de Defesa: 
30/06/2021 - 14:00
Banca examinadora: 
Prof. Dr. Anderson Rodrigues dos Santos - FACOM/UFU (Orientador)
Prof. Dr. Laurence Rodrigues Amaral - FACOM/UFU
Prof. Dr. Marcos Augusto dos Santos - UFMG

As interações proteína-proteína (do inglês, Protein-Protein Interactions – PPI) desempenham um papel fundamental na determinação do resultado da maioria dos processos celulares. Identificar corretamente as interações de proteínas e as redes de PPI que elas compreendem, é de fundamental importância para o entendimento dos mecanismos moleculares dentro da célula. Isso pode fornecer insights úteis na realização de tarefas críticas como a fabricação de drogas e vacinas contra doenças causadas por agentes infecciosos. Abordagens computacionais são utilizadas combinando várias fontes de dados biológicos, a fim de prever interações de proteínas com níveis satisfatórios de confiabilidade. Neste trabalho, propõe-se um novo software autônomo de bioinformática (GENPPI) para predição ab initio de redes de interação entre proteínas bacterianas. A solução proposta analisa genomas buscando por evidências de eventos evolutivos que indicam interações de proteínas. A saber, eventos de vizinhança gênica conservada, fusão gênica e perfil filogenético conservado. Este trabalho também introduz uma nova heurística para comparação par-a-par de sequências de aminoácidos de proteínas. Como resultados, primeiramente demonstra-se a eficácia da heurística proposta comparando sua exatidão com o BLASTp, o principal algoritmo heurístico para comparação de sequências proteicas. A exatidão do dois algoritmos heurísticos é estimada verificando qual se aproxima mais do algoritmo exato Needleman-Wunsh, utilizado para comparação de sequências biológicas. A heurística proposta superou o BLASTp apresentando maior exatidão na comparação par-a-par de proteínas e menor tempo de processamento. Posteriormente, a confiabilidade biológica das predições computacionais realizadas, é verificada. Para tanto, foram feitas análises de filogenia a partir de dados gerados pelo programa, após processar genomas de gêneros bacterianos selecionados como estudos de caso. Foram analisados 28 genomas do gênero Dietzia, 45 de Rhodococcus, 50 de Corynebacterium e 81 de Aeromonas. As análises de filogenia realizadas demonstram correção e confiabilidade biológica para as redes de interação proteica, preditas pelo software desenvolvido. Por final, compara-se a qualidade de redes de interação geradas pelo GENPPI com uma rede do STRING, a principal ferramenta do estado da arte deste trabalho. Tal comparação mostra que a solução proposta é capaz de gerar redes de tão boa qualidade quanto as redes do STRING. Vale mencionar que, com essa solução, é suprida uma deficiência identificada no estado da arte, a indisponibilidade de ferramentas computacionais para prever PPIs sem negligenciar proteínas inéditas. O software desenvolvido encontra-se disponível para download no repositório: <https://github.com/santosardr/genppi> , onde também contém um guia do usuário.