Algoritmo paralelo para determinação de autovalores de matrizes hermitianas

Miranda, Wilson Domingos Sidinei Alves

Registro completo de metadados

Campo DC	Valor	Idioma
dc.contributor.advisor	Enders Neto, Bernhard Georg	-
dc.contributor.author	Miranda, Wilson Domingos Sidinei Alves	-
dc.date.accessioned	2016-06-01T21:18:28Z	-
dc.date.available	2016-06-01T21:18:28Z	-
dc.date.issued	2016-06-01	-
dc.date.submitted	2015-08-05	-
dc.identifier.citation	MIRANDA, Wilson Domingos Sidinei Alves. Algoritmo paralelo para determinação de autovalores de matrizes hermitianas. 2015. 84 f. , il. Dissertação (Mestrado em Ciências de Materiais)–Universidade de Brasília, Brasília, 2015.	en
dc.identifier.uri	http://repositorio.unb.br/handle/10482/20642	-
dc.description	Dissertação (mestrado)–Universidade de Brasília, Universidade UnB de Planaltina, Programa de Pós-Graduação em Ciências de Materiais, 2015.	en
dc.description.abstract	Um dos principais problemas da álgebra linear computacional é o problema de autovalor, Au = lu, onde A é usualmente uma matriz de ordem grande. A maneira mais efetiva de resolver tal problema consiste em reduzir a matriz A para a forma tridiagonal e usar o método da bissecção ou algoritmo QR para encontrar alguns ou todos os autovalores. Este trabalho apresenta uma implementação em paralelo utilizando uma combinação dos métodos da bissecção, secante e Newton-Raphson para a solução de problemas de autovalores de matrizes hermitianas. A implementação é voltada para unidades de processamentos gráficos (GPUs) visando a utilização em computadores que possuam placas gráficas com arquitetura CUDA. Para comprovar a eficiência e aplicabilidade da implementação, comparamos o tempo gasto entre os algoritmos usando a GPU, a CPU e as rotinas DSTEBZ e DSTEVR da biblioteca LAPACK. O problema foi dividido em três fases, tridiagonalização, isolamento e extração, as duas últimas calculadas na GPU. A tridiagonalização via DSYTRD da LAPACK, calculada em CPU, mostrou-se mais eficiente do que a realizada em CUDA via DSYRDB. O uso do método zeroinNR na fase de extração em CUDA foi cerca de duas vezes mais rápido que o método da bissecção em CUDA. Então o método híbrido é o mais eficiente para o nosso caso.	en
dc.language.iso	Português	en
dc.rights	Acesso Aberto	en
dc.title	Algoritmo paralelo para determinação de autovalores de matrizes hermitianas	en
dc.type	Dissertação	en
dc.subject.keyword	Problemas de autovalor	en
dc.subject.keyword	Sequência de Sturm	en
dc.subject.keyword	Computação paralela	en
dc.subject.keyword	Matriz tridiagonal	en
dc.subject.keyword	Matriz simétrica	en
dc.rights.license	A concessão da licença deste item refere-se ao termo de autorização impresso assinado pelo autor com as seguintes condições: Na qualidade de titular dos direitos de autor da publicação, autorizo a Universidade de Brasília e o IBICT a disponibilizar por meio dos sites www.bce.unb.br, www.ibict.br, http://hercules.vtls.com/cgi-bin/ndltd/chameleon?lng=pt&skin=ndltd sem ressarcimento dos direitos autorais, de acordo com a Lei nº 9610/98, o texto integral da obra disponibilizada, conforme permissões assinaladas, para fins de leitura, impressão e/ou download, a título de divulgação da produção científica brasileira, a partir desta data.	en
dc.identifier.doi	http://dx.doi.org/10.26512/2015.08.D.20642	-
dc.description.abstract1	One of the main problems in computational linear algebra is the eigenvalue problem Au = lu, where A is usually a matrix of big order. The most effective way to solve this problem is to reduce the matrix A to tridiagonal form and use the method of bisection or QR algorithm to find some or all of the eigenvalues. This work presents a parallel implementation using a combination of methods bisection, secant and Newton-Raphson for solving the eigenvalues problem for Hermitian matrices. Implementation is focused on graphics processing units (GPUs) aimed at use in computers with graphics cards with CUDA architecture. To prove the efficiency and applicability of the implementation, we compare the time spent between the algorithms using the GPU, the CPU and DSTEBZ and DSTEVR routines from LAPACK library. The problem was divided into three phases, tridiagonalization, isolation and extraction, the last two calculated on the GPU. The tridiagonalization by LAPACK’s DSYTRD, calculated on the CPU, proved more efficient than the DSYRDB in CUDA. The use of the method zeroinNR on the extraction phase in CUDA was about two times faster than the bisection method in CUDA. So the hybrid method is more efficient for our case.	-
dc.description.unidade	Faculdade UnB Planaltina (FUP)	-
dc.description.ppg	Programa de Pós-Graduação em Ciências de Materiais	-
Aparece nas coleções:	Teses, dissertações e produtos pós-doutorado