Skip navigation
Use este identificador para citar ou linkar para este item: http://repositorio.unb.br/handle/10482/45443
Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
2022_CarlosAntonioCamposJorge.pdf2,93 MBAdobe PDFVisualizar/Abrir
Registro completo de metadados
Campo DCValorIdioma
dc.contributor.advisorMelo, Alba Cristina Magalhães Alves de-
dc.contributor.authorJorge, Carlos Antônio Campos-
dc.date.accessioned2023-01-05T21:36:17Z-
dc.date.available2023-01-05T21:36:17Z-
dc.date.issued2023-01-05-
dc.date.submitted2022-04-19-
dc.identifier.citationJORGE, Carlos Antônio Campos. Comparação paralela de sequências biológicas em plataformas de hardware uniformes e híbridas. 2022. xiii, 101 f., il. Tese (Doutorado em Informática) — Universidade de Brasília, Brasília, 2022.pt_BR
dc.identifier.urihttps://repositorio.unb.br/handle/10482/45443-
dc.descriptionTese (doutorado) — Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, 2022.pt_BR
dc.description.abstractO alinhamento de sequências expõe claramente os padrões mais relevantes entre duas sequências, sendo útil para descobrir informação funcional, estrutural e evolucionária em sequências biológicas. Para tanto, é necessário descobrir o alinhamento ótimo, ou seja, o padrão que maximiza a similaridade entre as sequências. O algoritmo Longest Common Subsequence (LCS) produz o alinhamento ótimo e, por isso, é muito utilizado ao redor do mundo. Devido à complexidade quadrática de tempo, sua execução pode demorar muito se as sequências comparadas forem longas. Por isso, plataformas de hardware como FPGAs (Field Programmable Gate Arrays) tem sido exploradas. Para simplificar a programação de hardware, foram propostas soluções de alto nível, como HLS (High Level Synthesis), que transforma automaticamente um programa C, C++ ou SystemC em uma especificação de hardware, simplificando a programação. Para atingir certa simplicidade da programação e, consequentemente, reduzir o tempo necessário para a obtenção do circuito, exploramos nessa Tese a programação em HLS e em C. Além disso, investigamos soluções para a execução do algoritmo LCS tanto em plataformas FPGA stand-alone como em plataformas híbridas (CPU+FPGA). Inicialmente, confeccionamos um circuito programado em HLS, que foi executado em uma plataforma FPGA stand-alone. O circuito projetado comporta até dois co-processadores, permitindo a comparação paralela de dois pares de sequências. As execuções no ambiente stand-alone de um lote de 20 comparações de sequências sintéticas de 10K, 20K e 50K mostraram que a execução em FPGA consome menos energia e que as execuções híbridas (CPU+FPGA) atingem desempenho muito bom. Adicionalmente, foi comparado um lote de 20 sequências reais do vírus SARSCoV-2 (30K) na plataforma stand-alone. Nesse caso, a configuração com 2 co-processadores, executando 2 comparações em CPU e 18 comparações em FPGA obteve bons resultados, tanto em tempo de execução como em consumo de energia. Finalmente, a solução projetada para execução híbrida (CPU+FPGA) em plataformas stand-alone foi adaptada para execução na instância f1 da nuvem AWS. Na comparação de lotes de 20 sequências de 50K na nuvem AWS, mostramos que a configuração FPGA-only com dois coprocessadores executou-se em menor tempo e consumiu menos energia do que as configurações CPU-only e híbridas.pt_BR
dc.description.sponsorshipCoordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES).pt_BR
dc.language.isoPortuguêspt_BR
dc.rightsAcesso Abertopt_BR
dc.titleComparação paralela de sequências biológicas em plataformas de hardware uniformes e híbridaspt_BR
dc.typeTesept_BR
dc.subject.keywordSequências biológicas - comparaçãopt_BR
dc.subject.keywordField Programmable Gate Arrays (FPGAs)pt_BR
dc.subject.keywordHardware reconfigurávelpt_BR
dc.rights.licenseA concessão da licença deste item refere-se ao termo de autorização impresso assinado pelo autor com as seguintes condições: Na qualidade de titular dos direitos de autor da publicação, autorizo a Universidade de Brasília e o IBICT a disponibilizar por meio dos sites www.bce.unb.br, www.ibict.br, http://hercules.vtls.com/cgi-bin/ndltd/chameleon?lng=pt&skin=ndltd sem ressarcimento dos direitos autorais, de acordo com a Lei nº 9610/98, o texto integral da obra disponibilizada, conforme permissões assinaladas, para fins de leitura, impressão e/ou download, a título de divulgação da produção científica brasileira, a partir desta data.pt_BR
dc.description.abstract1Sequence alignment clearly exposes the most relevant patterns between two sequences, being useful for discovering functional, structural and evolutionary information in biological sequences. Therefore, it is necessary to find the optimal alignment, that is, the pattern that maximizes the similarity between the sequences. The Longest Common Subsequence (LCS) algorithm produces the optimal alignment and is therefore widely used around the world. Due to the quadratic complexity of time, its execution can take a long time if the compared sequences are long. Therefore, hardware platforms such as FPGAs (Field Programmable Gate Arrays) have been explored. To simplify hardware programming, high-level solutions have been proposed, such as HLS (High Level Synthesis), which automatically transforms a C, C++ or SystemC program into a hardware specification, simplifying programming. In order to achieve a certain simplicity of programming and, consequently, reduce the time needed to obtain the circuit, in this thesis we explore programming in HLS and in C. In addition, we investigate solutions for the execution of the LCS algorithm both on FPGA stand -alone as on hybrid platforms (CPU+FPGA). Initially, we made a circuit programmed in HLS, which was executed on an FPGA stand-alone platform. The designed circuit supports up to two co-processors, allowing the parallel comparison of two pairs of sequences. Executions in the stand-alone environment of a batch of 20 comparisons of 10K, 20K and 50K synthetic sequences showed that the FPGA execution consumes less power and that the hybrid executions (CPU+FPGA) achieve very good performance. Additionally, a batch of 20 real sequences of the SARS-CoV-2 virus (30K) on the stand-alone platform was compared. In this case, the configuration with 2 coprocessors, running 2 comparisons on CPU and 18 comparisons on FPGA obtained good results, both in execution time and in power consumption. Finally, the solution designed for hybrid execution (CPU+FPGA) on stand-alone platforms was adapted to run on the f1 instance of the AWS cloud. In comparing batches of 20 50K sequences in the AWS cloud, we showed that the FPGA-only configuration with two co-processors ran in less time and consumed less power than the CPU-only configurations. and hybrids.pt_BR
dc.description.unidadeInstituto de Ciências Exatas (IE)pt_BR
dc.description.unidadeDepartamento de Ciência da Computação (IE CIC)pt_BR
dc.description.ppgPrograma de Pós-Graduação em Informáticapt_BR
Aparece nas coleções:Teses, dissertações e produtos pós-doutorado

Mostrar registro simples do item Visualizar estatísticas



Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.