http://repositorio.unb.br/handle/10482/46159
File | Description | Size | Format | |
---|---|---|---|---|
2022_JoãoAntonioAlvesNunes.pdf | 9,52 MB | Adobe PDF | View/Open |
Title: | Resolução de novas interações proteína-proteína a partir de paisagens de sequências artificiais |
Authors: | Nunes, João Antonio Alves |
Orientador(es):: | Treptow, Werner L. |
Assunto:: | Interação proteína-proteína Coevolução molecular Paisagens |
Issue Date: | 20-Jul-2023 |
Data de defesa:: | 10-Aug-2022 |
Citation: | NUNES, João Antonio Alves. Resolução de novas interações proteína-proteína a partir de paisagens de sequências artificiais. 2022. 38 f., il. Dissertação (Mestrado em Patologia Molecular) — Universidade de Brasília, Brasília, 2022. |
Abstract: | Teorias coevolutivas descrevem a distribuição de probabilidade de proteínas que interagem em termos de um modelo estatístico de Boltzmann. Como resultado de pressões seletivas, espera-se que essa distribuição se desvie acentuadamente da uniformidade apresentando um número relativamente pequeno de sequências muito prováveis em todo o espaço de sequências. Enquanto essa afirmação deva ser verdadeira para sistemas interólogos em geral, suas distribuições de sequência podem não ter sido totalmente moldadas por pressões seletivas, abrindo a possibilidade de que novas sequências interólogas possam ser selecionadas a partir de distribuições de menor entropia geradas artificialmente. O objetivo desse trabalho foi investigar o significado físico de novas sequências selecionadas a partir de paisagens de fitness artificiais. Para isso, exploramos um Algoritmo Genético, que resolve a distribuição maximizando os acoplamentos estatísticos, começando de um alinhamento múltiplo de sequências nativo e explorando o espaço de alinhamentos múltiplo de sequências embaralhados. Também resolvemos uma distribuição minimizando os acoplamentos estatísticos através do embaralhamento ao acaso do alinhamento múltiplo de sequências. Uma vez que as sequências artificiais foram selecionadas a partir das distribuições maximizadas e minimizadas, suas energias livre de ligação em uma pose de interação nativa fixa foram avaliadas de acordo com os cálculos de energia livre baseados no método MM/PBSA. Para avaliar o sentido físico das sequências nativas e artificiais calculamos a temperatura de seleção em relação a sequências aleatórias de mesma composição. Nossos resultados apontam que é possível selecionar novas sequências artificiais não-similares em temperaturas de seleção mais frias ou mais quentes que a temperatura de seleção nativa e, que as sequências artificiais selecionadas apresentam diferenças apenas quanto ao design de sequências, mas não em relação à afinidade de ligação. É possível concluir que a evolução molecular da interação de dímeros não-obrigatórias pode ser restrita somente pelo design, já que a afinidade deve ser apenas consequência da composição de aminoácidos determinada pelas restrições de enovelamento. Além disso, constata-se a possibilidade de encontrar novas interações proteína-proteína com características iguais ou melhores que as interações existentes na natureza. |
Abstract: | Coevolutionary theories describe the probability distribution of interacting proteins in terms of a Boltzmann statistical model. As a result of selective pressures, that distribution is expected to sharply deviate from uniformity by featuring a relatively small number of highly probable sequences across the entire sequence space. While that statement must be true for interolog systems in general, their sequence distributions may have not been fully shaped by selective pressures opening the possibility that novel interolog sequences could be selected from artificially generated lower entropy distributions. The goal of this work was to investigate the physical meaning of selected sequences from artificial fitness landscapes. For that, we explore a Genetic Algorithm, which solves the distributions by maximizing the statistical coupling, starting from the native multi-sequence alignments and exploring the space of scrambled multi-sequence alignments. We also solve a distribution by minimizing statistical couplings through random shuffling of multiple sequence alignment. Once likely artificial sequences are selected from maximized and minimized distributions, their binding free-energies at a fixed native bound state are evaluated according to free energy calculations based on the MM/PBSA method. To evaluate the physical meaning of native and artificial sequences, we calculated the selection temperature in relation to random sequences of the same composition. Our results indicate that it is possible to select new non-similar artificial sequences at colder or warmer selection temperatures than the native selection temperature, and that the selected artificial sequences show differences only in sequence design, but not in relation to binding affinity. It is possible to conclude that the molecular evolution of the interaction of non-obligate dimers can be restricted only by sequence design, since the affinity must only be a consequence of the amino acid composition determined by the folding restrictions. In addition, it is possible to find new protein-protein interactions with characteristics equal to or better than the interactions existing in nature. |
metadata.dc.description.unidade: | Faculdade de Medicina (FMD) |
Description: | Dissertação (mestrado) — Universidade de Brasília, Faculdade de Medicina, Programa de Pós-Graduação em Patologia Molecular, 2022. |
metadata.dc.description.ppg: | Programa de Pós-Graduação em Patologia Molecular |
Agência financiadora: | Conselho Nacional de Desenvolvimento Científico e Tecnológico (CNPq) e Fundação de Apoio à Pesquisa do Distrito Federal (FAP/DF). |
Appears in Collections: | Teses, dissertações e produtos pós-doutorado |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.