Organização da informação : uma proposta de framework genérico para geração automática de assuntos, indexação e busca facetada em repositórios digitais

Brito, Jean Carlos Borges

Use este identificador para citar ou linkar para este item: http://repositorio.unb.br/handle/10482/48817

Arquivos associados a este item:

Arquivo	Descrição	Tamanho	Formato
JeanCarlosBorgesBrito_TESE.pdf		3,19 MB	Adobe PDF	Visualizar/Abrir

Título:	Organização da informação : uma proposta de framework genérico para geração automática de assuntos, indexação e busca facetada em repositórios digitais
Autor(es):	Brito, Jean Carlos Borges
Orientador(es):	Martins, Dalton Lopes
Assunto:	Descritores Repositórios Digitais Metadados Tesauros Indexação
Data de publicação:	12-Jul-2024
Data de defesa:	21-Nov-2023
Referência:	BRITO, Jean Carlos Borges. Organização da informação: uma proposta de framework genérico para geração automática de assuntos, indexação e busca facetada em repositórios digitais . 2023. 139 f., il. Tese (Doutorado em Ciência Da Informação) — Universidade de Brasília, Brasília, 2023.
Resumo:	Introdução. Com o aumento exponencial de dados, devido a sua característica digital, amplia-se também os problemas de ausência ou a discrepância de metadados cadastrados, tornando um trabalho oneroso e árduo para um ser humano corrigi-los manualmente. Surge a necessidade de investigações para melhorar a organização e facilitar recuperação da informação. Nesse contexto, a aplicação de inteligência artificial através da aprendizagem de máquina, utilizando ferramentas automáticas e semiautomáticas de forma complementar para coleta de metadados e geração de assuntos, propicia a melhoria de sua indexação e buscas nos repositórios digitais. Objetivo. Propor um framework genérico com um conjunto de atividades e técnicas para executar a geração e indexação automática de assuntos em um repositório digital, visando a organização e a recuperação da informação. Métodos. Revisão Sistemática da Literatura, estudando sobre o tema de geração automática e semiautomática de metadados, suas ferramentas, técnicas, características e funções. Realizouse pesquisa exploratória em bases de dados científicas da Ciência da Informação, selecionando periódicos específicos para a avaliação de acordo com as principais listas de classificação. Utilizou-se método misto na análise dos dados, com abordagens quantitativas e qualitativas, sendo definido um protocolo rigoroso de revisão. Identificou-se ferramentas para auxiliar a pesquisa aplicada, através da sua customização e uso em conjunto de vários algoritmos de aprendizagem de máquina que auxiliassem no processo de geração automática de assuntos. Ao final, realizou-se um estudo de caso aplicado para o “modelo de pesquisa”. Resultados. Conclui-se que as técnicas de geração automática de metadados auxiliam na sugestão de assuntos para documentos robustos como uma tese e dissertação, ampliando o quantitativo de descritores, de modo a facilitar a configuração de taxonomias, filtros e facetas. Esse trabalho propôs o framework genérico validado pelo modelo de pesquisa, através do estudo de caso aplicado. Esse framework pode ser adequado e aplicado em qualquer área do conhecimento, com intuito de melhorar e facilitar a busca e a recuperação da informação nos repositórios digitais pelos usuários e gestores desses acervos.
Abstract:	Introduction. With the exponential increase in data, due to its digital nature, problems with the absence or discrepancy of registered metadata also increase, making it an expensive and arduous job for a human being to correct them manually. There is a need for investigations to improve the organization and facilitate information retrieval. In this context, the application of artificial intelligence through machine learning, using automatic and semi-automatic tools in a complementary way to collect metadata and generate subjects, improves indexing and searches in digital repositories. Goal. Propose a generic framework with a set of activities and techniques to automatically generate and index subjects in a digital repository, aiming at organizing and retrieving information. Methods. Systematic Literature Review, studying the subject of automatic and semiautomatic generation of metadata, its tools, techniques, characteristics and functions. Exploratory research was carried out in scientific databases of Information Science, selecting specific journals for evaluation according to the main classification lists. A mixed method was used for data analysis, with quantitative and qualitative approaches, with a strict review protocol being defined. Tools were identified to help applied research, through their customization and joint use of several machine learning algorithms that would help in the process of automatic subject generation. At the end, a case study applied to the “research model” was carried out. Results. It is concluded that the automatic generation of metadata techniques help in suggesting subjects for robust documents such as a thesis and dissertation, expanding the number of descriptors, in order to facilitate the configuration of taxonomies, filters and facets. This work proposed the generic framework validated by the research model, through the applied case study. This framework can be adapted and applied in any area of knowledge, with the aim of improving and facilitating the search and retrieval of information in digital repositories by users and managers of these collections.
Unidade Acadêmica:	Faculdade de Ciência da Informação (FCI)
Informações adicionais:	Tese (doutorado) — Universidade de Brasília, Faculdade de Ciência da Informação, Programa de Pós-Graduação em Ciência da Informação, 2023.
Programa de pós-graduação:	Programa de Pós-Graduação em Ciência da Informação
Aparece nas coleções:	Teses, dissertações e produtos pós-doutorado

Mostrar registro completo do item Visualizar estatísticas