http://repositorio.unb.br/handle/10482/13153
File | Description | Size | Format | |
---|---|---|---|---|
2012_DanielSundfeldLima.pdf | 2,22 MB | Adobe PDF | View/Open |
Title: | Estratégia paralela exata para o alinhamento múlltiplo de sequências biológicas utilizando Unidades de Processamento Gráfico (GPU) |
Authors: | Lima, Daniel Sundfeld |
Orientador(es):: | Melo, Alba Cristina Magalhães Alves de |
Assunto:: | Biologia computacional Sequências (Matemática) Programação paralela (Computação) Unidades de Processamento Gráfico (GPUs) |
Issue Date: | 20-May-2013 |
Data de defesa:: | 28-Aug-2012 |
Citation: | LIMA, Daniel Sundfeld. Estratégia paralela exata para o alinhamento múlltiplo de sequências biológicas utilizando Unidades de Processamento Gráfico (GPU). 2012. viii, 73 f., il. Dissertação (Mestrado em Informática)—Universidade de Brasília, Brasília, 2012. |
Abstract: | O alinhamento múltiplo de sequências biológicas é um problema muito importante em
Biologia Molecular, pois permite que sejam detectadas similaridades e diferenças entre um conjunto de sequências. Esse problema foi provado NP-Difícil e, por essa razão, geralmente algoritmos heurísticos são usados para resolvê-lo. No entanto, a obtenção da solucão ótima é bastante desejada e, por essa razão, existem alguns algoritmos exatos que solucionam esse problema para um número reduzido de sequências. Dentre esses algoritmos, destaca-se o método exato Carrillo-Lipman, que permite reduzir o espaço de busca utilizando um limite inferior e superior. Mesmo com essa redução, o algoritmo com Carrillo-Lipman executa-se em tempo exponencial. Com o objetivo de acelerar a obtenção de resultados,
plataformas computacionais de alto desempenho podem ser utilizadas para resolver o
problema do alinhamento múltiplo. Dentre essas plataformas, destacam-se as Unidades
de Processamento Gráfico (GPU) devido ao seu potencial para paralelismo massivo e
baixo custo. O objetivo dessa dissertação de mestrado é propor e avaliar uma estratégia
paralela para execução do algoritmo Carrillo-Lipman em GPU. A nossa estratégia permite
a exploração do paralelismo em granularidade na, onde o espaço de busca é percorrido
por várias threads em um cubo tridimensional, divido em janelas de processamento que
são diagonais projetadas em duas dimensões. Os resultados obtidos com a comparação de
conjuntos de 3 sequências reais e sintéticas de diversos tamanhos mostram que speedups
de até 8,60x podem ser atingidos com a nossa estratégia. ______________________________________________________________________________ ABSTRACT Multiple Sequence Alignment is a very important problem in Molecular Biology since it is able to detect similarities and di erences in a set of sequences. This problem has been proven NP-Hard and, for this reason, heuristic algorithms are usually used to solve it. Nevertheless, obtaining the optimal solution is highly desirable and there are indeed some exact algorithms that solve this problemfor a reduced number of sequences. Carrillo-Lipman is a well-known exact algorithmfor the Multiple Sequence Alignment problemthat is able to reduce the search space by using inferior and superior bounds. Even with this reduction, the Carrillo-Lipman algorithm executes in exponential time. High Performance Computing (HPC) Platforms can be used in order to produce results faster. Among the existing HPC platforms, GPUs (Graphics Processing Units) are receiving a lot of attention due to their massive parallelism and low cost. The goal of this MsC dissertation is to propose and evaluate a parallel strategy to execute the Carrillo-Lipman algorithm in GPU. Our strategy explores parallelism at ne granularity, where the search space is a tridimensional cube, divided on processing windows with bidimensional diagonals, explored by multiple threads. The results obtained when comparing several sets of 3 real and synthetic sequences show that speedups of 8.60x can be obtained with our strategy. |
metadata.dc.description.unidade: | Instituto de Ciências Exatas (IE) Departamento de Ciência da Computação (IE CIC) |
Description: | Dissertação (mestrado)—Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, 2012. |
metadata.dc.description.ppg: | Programa de Pós-Graduação em Informática |
Licença:: | A concessão da licença deste item refere-se ao termo de autorização impresso assinado pelo autor com as seguintes condições: Na qualidade de titular dos direitos de autor da publicação, autorizo a Universidade de Brasília e o IBICT a disponibilizar por meio dos sites www.bce.unb.br, www.ibict.br, http://hercules.vtls.com/cgi-bin/ndltd/chameleon?lng=pt&skin=ndltd sem ressarcimento dos direitos autorais, de acordo com a Lei nº 9610/98, o texto integral da obra disponibilizada, conforme permissões assinaladas, para fins de leitura, impressão e/ou download, a título de divulgação da produção científica brasileira, a partir desta data. |
Appears in Collections: | Teses, dissertações e produtos pós-doutorado |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.