Métodos para comparação e compressão de dados genômicos

por Marcelo Zanchetta do Nascimento
Publicado: 18/09/2023 - 15:18
Última modificação: 18/09/2023 - 15:18

Métodos para comparação e compressão de dados genômicos Descrição: Tecnologias de sequenciamento de alto rendimento (HTS - High Throughput Sequencing) têm reduzido custos e acelerado a quantidade de dados genômicos produzidos. O sequenciamento de um único genoma humano, por exemplo, pode produzir mais de 100 GB, com milhões de pequenos fragmentos de sequências de DNA (reads) que são armazenadas em arquivos de texto, geralmente no formato FASTQ. Estruturas de dados compactas baseadas na transformada de Burrows-Wheeler (BWT) têm desempenhado um papel importante no desenvolvimento de novos métodos para comparação e para compressão dados textuais. O objetivo deste projeto é investigar novas soluções utilizando essas estruturas para os seguintes problemas em Biologia Computacional: (1) comparação de genomas por meio de grafos de Bruijn sucintos; (2) identificação de sobreposições do tipo sufixo-prefixo entre cadeias; e (3) compressão de dados genômicos armazenados em arquivos FASTQ. Em particular, pretendemos propor soluções que utilizam pouco espaço auxiliar em memória principal (RAM), ou utilizam memória externa (disco) para permitir o processamento de grandes volumes de dados. Portanto, este projeto pretende contribuir com o avanço e desenvolvimento de novas soluções para comparação e para compressão de dados genômicos.

Financiadores: 
Responsável: 
Linhas de Pesquisa: