Cálculo da distância de reversão e construção de árvores filogenéticas usando a ordem dos genes

Soncco Álvarez, José Luis

Please use this identifier to cite or link to this item: http://repositorio.unb.br/handle/10482/23520

Files in This Item:

File	Description	Size	Format
2017_JoséLuisSonccoÁlvarez.pdf		1,39 MB	Adobe PDF	View/Open

Title:	Cálculo da distância de reversão e construção de árvores filogenéticas usando a ordem dos genes
Authors:	Soncco Álvarez, José Luis
Orientador(es)::	Ayala-Rincón, Mauricio
Assunto::	Algoritmos genéticos Filogenia
Issue Date:	17-May-2017
Data de defesa::	3-Mar-2017
Citation:	SONNCO ÁLVAREZ, José Luis. Cálculo da distância de reversão e construção de árvores filogenéticas usando a ordem dos genes. 2017. x, 93 f., il. Tese (Doutorado em Informática)—Universidade de Brasília, Brasília, 2017.
Abstract:	O cálculo de distâncias evolutivas, como as distâncias de reversão e double cut and join, entre a ordem dos genes de dois organismos e um problema combinatório complexo. Este cenário pode ficar ainda mais complicado se quisermos construir árvores filogenéticas, visto que a maioria das abordagens da literatura primeiro solucionam o problema da mediana de três genomas, o qual foi demonstrado ser NP-Difícil para vários modelos evolutivos. Neste trabalho propomos vários algoritmos evolutivos para o problema de ordenação de permutações (sem sinal) por reversões, cuja saída e a distancia de reversão. Estes algoritmos são baseados em um algoritmo genético simples, sobre o qual foram incorporados varias heurísticas como busca local, busca por oposição, e eliminação de pontos de quebra. Experimentos foram realizados usando diferentes dados (permutações) baseados na ordem dos genes, os quais foram gerados artificialmente (de forma aleatória) e também a partir de dados biológicos. Dentre estes algoritmos os que melhores resultados tem para casos práticos, ou seja, permutações de comprimento ate 120, são os chamados AMBO e AMBO-Híbrido. Estes resultados foram validados usando testes estatísticos como Friedman e Holm. Adicionalmente, foi implementado um software para construir arvores filogenéticas chamado de HELPHY, que toma como entrada dados baseados na ordem dos genes (permutações com sinal). Primeiro foi proposto um algoritmo guloso para o problema da pequena filogenia, cujo objetivo e calcular o custo de uma determinada árvore. Logo, para o problema da grande filogenia foi proposta uma abordagem baseada em busca em vizinhança variável, cujo objetivo e explorar o espaço de soluções de estruturas de árvores. Experimentos mostraram que HELPHY conseguiu melhorar o tempo de execução para encontrar árvores com bons escores (distância de reversão) para o dataset Campanulaceae; além disso, uma nova árvore tendo o melhor escore (distância double cut and join) na literatura foi encontrado para o dataset Hemiascomycetes.
Abstract:	Calculating evolutionary distances, such as the reversal distance or the double cut and join distance, between the gene orders of two organisms is a complex combinatory problem. This scenario can be even more complicated if we want to build phylogenetic trees, since most of the approaches in the literature first solves the median problem for three genomes, which was shown to be NP-Hard for various evolutionary models. In this work, we are proposing several evolutionary algorithms for the problem of sorting (unsigned) permutations by reversals, whose output is the reversal distance. These algorithms are based on a simple genetic algorithm, on which were embedded different heuristics such as local search, opposition-based learning, and elimination of breakpoints. Experiments were performed using different types of data (permutations) based on gene orders which were generated artificially (in a random way) and also from biological data. From these algorithms, the ones with the best results for practical cases, that is, permutations of length up to 120, are called as AMBO and AMBO-Hibrido. These results were validated by applying the Friedman and Holm statistical tests. Moreover, a software called HELPHY for building phylogenetic trees was implemented, which takes as input data based on gene order (signed permutations). First, an greedy algorithm was proposed for the small phylogeny problem, whose aim is to calculate the cost (score) of a given tree structure. Then, an approach based on variable neighborhood search was proposed for the large phylogeny problem, whose aim is to explore the search space of tree structures. Results of the experiments showed that HELPHY improved the execution time for finding good scores (reversal distance) for the dataset Campanulaceae; besides, a new tree structure with the best score (double cut and join distance) in the literature was found for the dataset Hemiascomycetes.
metadata.dc.description.unidade:	Instituto de Ciências Exatas (IE) Departamento de Ciência da Computação (IE CIC)
Description:	Tese (doutorado)—Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, 2017.
metadata.dc.description.ppg:	Programa de Pós-Graduação em Informática
Licença::	A concessão da licença deste item refere-se ao termo de autorização impresso assinado pelo autor com as seguintes condições: Na qualidade de titular dos direitos de autor da publicação, autorizo a Universidade de Brasília e o IBICT a disponibilizar por meio dos sites www.bce.unb.br, www.ibict.br, http://hercules.vtls.com/cgi-bin/ndltd/chameleon?lng=pt&skin=ndltd sem ressarcimento dos direitos autorais, de acordo com a Lei nº 9610/98, o texto integral da obra disponibilizada, conforme permissões assinaladas, para fins de leitura, impressão e/ou download, a título de divulgação da produção científica brasileira, a partir desta data.
DOI:	http://dx.doi.org/10.26512/2017.03.T.23520
Appears in Collections:	Teses, dissertações e produtos pós-doutorado

Show full item record " class="statisticsLink btn btn-primary" href="/jspui/handle/10482/23520/statistics">