http://repositorio.unb.br/handle/10482/47907
File | Description | Size | Format | |
---|---|---|---|---|
DeborahRibeiroBambil_TESE.pdf | 3,12 MB | Adobe PDF | View/Open |
Title: | Ferramenta computacional de identificação e análise de redundância de pre-mirnas em plantas |
Authors: | Bambil, Deborah Ribeiro |
Orientador(es):: | Figueiredo, Lúcio Flávio de Alencar |
Assunto:: | Ipê roxo Mineração de dados Modelo Oculto de Markov (HMM) |
Issue Date: | 27-Feb-2024 |
Data de defesa:: | 25-Jul-2023 |
Citation: | BAMBIL, Deborah Ribeiro Bambil. Ferramenta computacional de identificação e análise de redundância de pre-mirnas em plantas. 2023. 76 f., il. Tese (Doutorado em Biotecnologia e Biodiversidade) — Universidade de Brasília, Brasília, 2023. |
Abstract: | microRNAs (miRNAs) são sequências curtas de RNAs não codificantes que atuam na expressão gênica. O objetivo deste trabalho foi realizar a mineração de pre-miRNAs e miRNAs de plantas analisando a redundância nos pre-miRNAs com a identidade entre 95 a 70% e construir uma ferramenta computacional baseada em modelos de covariância e ocultos, para identificar novos pre-miRNAs. Os pre-miRNAs selecionados tinham de 70 a 300 nt. Assim, 8045 pre-miRNAs de 2623 famílias foram minerados no miRBase, a partir de 8677 e 2942, respectivamente. Uma redução de 11 e 7% de sequências e famílias de pre-miRNAs. As angiospermas possuíam o maior número de famílias de pre-miRNAs (n=2202), seguido das gimnospermas (n=272), briófitas (n=121) e algas (n=78). A análise de redundância foi feita pela similaridade em cores classificadas com o algoritmo Deep Learning com a ferramenta Weka. A métrica medida-F, resultante do DL, apresentou o resultado da classificação por cores, que foi usada para fazer a ANOVA, onde o limite de 80% foi significativo em comparação com os outros limites. A ferramenta computacional PmiR-Select foi registrada como propriedade intelectual (nº BR512022001292). Essa ferramenta foi baseada em modelos de covariância que identificou 8470 novos pre-miRNAs no genoma do arroz, que são homólogos a 36 famílias. Dessas, 17 famílias existentes no miRBase para o arroz e 19 seriam de novas famílias, que representam um aumento de 5% de famílias de pre-miRNAs depositados para o arroz (341 famílias). Esses novos pre-miRNAs e suas famílias auxiliam o delineamento e análise de resultados de experimentos de bancada ou computacional. No genoma do ipê rosa (503 Mb), foi utilizada a PmiR-Select, que identificou 305 novos pre miRNAs homólogos a 22 famílias de pre-miRNAs, enquanto com os modelos ocultos de Markov (HMM) foram identificados 1293 pre-miRNAs de 73 famílias. Dessas 95 familias, somente uma ocorreu em comum entre os dois modelos, fortalecendo a complementaridade deles. A PmiR-Select e o HMM estão analisando o RNA-Seq do ipê rosa e outras três árvores da família Bignoniaceae quanto a plasticidade fenotípica para seca em genes expressos diferencialmente em dois ecossistemas: i) savana e ii) floresta tropical sazonalmente seca. O ipê rosa é nativo e simbólico do bioma cerrado. O uso da PmiR-Select e o do HMM abrem oportunidades para a exploração inicial de novos pre-miRNAs de espécies nativas para diferentes clados, assim como para estratos específicos dos diversos biomas. |
Abstract: | microRNAs (miRNAs) are small sequences of non-coding RNAs that play a role in gene expression. The study aimed to conduct the mining of plant pre-miRNAs and miRNAs by analyzing redundancy in pre-miRNAs with identities ranging from 95 to 70% and to develop a computational tool based on covariance and hidden model approaches to identify novel pre miRNAs. The selected pre-miRNAs ranged from 70 to 300 nt. Thus, 8045 pre-miRNAs from 2623 families were mined in the miRBase, originating from 8677 and 2942, respectively; this represented an 11% and 7% reduction in pre-miRNA sequences and families. Angiosperms exhibited the highest number of pre-miRNA families (n=2202), followed by gymnosperms (n=272), bryophytes (n=121), and algae (n=78). The redundancy analysis assessed color similarity using the Deep Learning algorithm through the Weka tool. The resulting metric, measured-F from the Deep Learning, provided the outcome of color-based classification employed for ANOVA, where the 80% threshold exhibited significance compared to other thresholds. The computational tool, PmiR-Select, was registered as an intellectual property (registration no. BR512022001292). This tool successfully identified 8470 new pre-miRNAs in the rice genome, which are homologous to 36 families. Among these, 17 families already existed in the miRBase for rice, while 19 would be new families, representing a 5% increase in deposited pre-miRNA families for rice (341 families). These novel pre-miRNAs and families could aid in shaping and analyzing results from future bench or computational experiments. In the genome of the pink trumpet tree, utilizing the Hidden Markov Model based pipeline, 1293 pre-miRNAs from 73 families were identified. Of these 95 families, only one was shared between the two models, reinforcing their complementary nature. The PmiR Select and HMM methods are employed to analyze RNA-Seq data from pink ipê and three other trees within the Bignoniaceae family. This analysis aims to understand phenotypic plasticity in response to drought, focusing on differentially expressed genes in two distinct ecosystems: i) savanna and ii) seasonally dry tropical forest. The pink ipê is native and symbolic of the cerrado biome. The utilization of the PmiR-Select and HMM approach creates opportunities for the preliminary exploration of new pre-miRNAs from native species across various clades, as well as for specific strata within diverse biomes. |
metadata.dc.description.unidade: | Instituto de Ciências Biológicas (IB) |
Description: | Programa de Pós-Graduação em Economia, 2023.Tese (doutorado) — Universidade de Brasília, Programa em Rede Multi-Institucional do Pró-Centro-Oeste de Pós-Graduação em Biotecnologia e Biodiversidade, 2023. |
metadata.dc.description.ppg: | Programa de Pós-Graduação em Biotecnologia e Biodiversidade (Rede PRÓ-CENTRO-OESTE) |
Appears in Collections: | Teses, dissertações e produtos pós-doutorado |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.