Skip navigation
Use este identificador para citar ou linkar para este item: http://repositorio.unb.br/handle/10482/49967
Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
JessicaSousaOliveira_DISSERT.pdf2,87 MBAdobe PDFVisualizar/Abrir
Título: Web scraping na extração e combinação sistemática de conteúdos : ferramenta auxiliar em processos de pesquisa, desenvolvimento e inovação (PD&I)
Autor(es): Oliveira, Jessica Sousa
E-mail do autor: eijessicasousa@gmail.com
Orientador(es): Rosa, Mário Fabrício Fleury
Assunto: Lei de inovação tecnológica
Exploração de dados
Web scraping
Pesquisa científica
Data de publicação: 16-Ago-2024
Referência: OLIVEIRA, Jessica Sousa. Web scraping na extração e combinação sistemática de conteúdos: ferramenta auxiliar em processos de pesquisa, desenvolvimento e inovação (PD&I). 2023. 83 f., il. Dissertação (Mestrado em Engenharia Biomédica) — Brasília, 2023.
Resumo: Introdução: O Marco Legal da Ciência, Tecnologia e Inovação tem como propósito a contribuição para com o desenvolvimento sustentável do Brasil, coordenando e alocando recursos com vistas a garantir produtos ou estudos científicos, tecnológicos, industriais e comerciais no país. Para que as instituições públicas de ensino superior possam usufruir dos direitos garantidos por este marco, é necessário que evidenciem e tornem públicas suas contribuições para a sociedade incluindo a translação do desenvolvimento científico para usufruto social. Nesse viés, evidencia-se a demanda por uma busca sistemática que enfatize as iniciativas científicas e tecnológicas desenvolvidas por estas instituições que, posteriormente, culminaram em produtos técnicos e tecnológicos para além daspublicações, mas principalmente patentes e/ou transferência tecnológicas. Objetivos: Surge então, como uma solução tecnológica viável, o desenvolvimento de uma aplicação que automatize esse processo. Este trabalho visa entregar uma ferramenta de mineração de dados, baseada em Web Scraping, que realize uma coleta capaz de extrair e combinar conteúdo da web de maneira sistemática e prática, buscando autores de projetos desenvolvidos na Universidade de Brasília que, posteriormente, translacionaram seus resultados para patentes e/ou transferências tecnológicas. Metodologia: Para tanto, utilizou-se uma abordagem aplicada, visando solucionar um problema específico que envolve interesses locais. Com base em revisões bibliográficas e em produtos de pesquisas semelhantes, espera-se que o scraper facilite a extração de informações acerca de projetos de pesquisa depositados em determinado repositório online e que, ao combinar os dados obtidos com os que foram minerados de uma base de patentes e/ou transferências tecnológicas, comprove o retorno de estudos, produções e pesquisas para o desenvolvimento econômico e social do país. Resultados: Como resultado da execução da ferramenta no repositório do Instituto Nacional da Propriedade Industrial, obteve-se 783 nomes de inventores de patentes; e a aplicação no repositório da Universidade de Brasília retornou 53.704 autores de projetos desenvolvidos na universidade. Após a comparação das tabelas geradas, considera-se 3.244 registros referentes aos autores que depositaram alguma patente, o que auxilia na análise das pesquisas que se tornaram inovações. Conclusão: O desfecho aponta que a ferramenta desenvolvida é funcional ao que se destina, considerando-se também que o cruzamento de informações é totalmente viável, podendo ser incorporado em análises e/ou aperfeiçoamento de processos que maximizem os indicadores de inovação gerados pelas universidades mitigando o Marco Legal da Ciência, Tecnologia e Inovação.
Abstract: Introduction: The Legal Framework for Science, Technology, and Innovation aims to contribute to the sustainable development of Brazil by coordinating and allocating resources to ensure scientific, technological, industrial, and commercial products or studies in the country. For public institutions of higher education to benefit from the rights guaranteed by this framework, it is necessary for them to demonstrate and make public their contributions to society, including the translation of scientific development for social benefit. In this regard, there is a demand for a systematic search that emphasizes the scientific and technological initiatives developed by these institutions, which subsequently result in technical and technological products beyond publications, but mainly patents and/or technology transfer. Objectives: Therefore, the development of an application that automates this process emerges as a viable technological solution. This work aims to deliver a data mining tool based on web scraping that performs systematic and practical data collection by extracting and combining web content, seeking authors of projects developed at the University of Brasília who have subsequently translated their results into patents and/or technology transfers. Methodology: To this end, an applied approach was used, aiming to solve a specific problem involving local interests. Based on literature reviews and similar research products, it is expected that the scraper will facilitate the extraction of information about research projects deposited in a specific online repository and, by combining the obtained data with those mined from a database of patents and/or technology transfers, demonstrate the return of studies, productions, and research to the country's economic and social development. Results: As a result of running the tool on the repository of the National Institute of Industrial Property, we obtained 783 patent inventors' names. The application on the repository of the University of Brasília returned 53,704 authors of projects developed at the university. After comparing the generated tables, we identified 3,244 records corresponding to authors who filed patents, which assists in the analysis of research that led to innovations. Conclusion: The outcome indicates that the developed tool is functional for its intended purpose, considering that the cross referencing of information is entirely feasible and can be incorporated into analyses and/or process improvements that maximize the innovation indicators generated by universities, mitigating the Legal Framework for Science, Technology, and Innovation.
Unidade Acadêmica: Faculdade UnB Gama (FGA)
Informações adicionais: Dissertação (mestrado) — Universidade de Brasília, Faculdade UnB Gama, Programa de Pós-Graduação em Engenharia Biomédica, 2023.
Programa de pós-graduação: Programa de Pós-Graduação em Engenharia Biomédica
Aparece nas coleções:Teses, dissertações e produtos pós-doutorado

Mostrar registro completo do item Visualizar estatísticas



Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.