Proposta de arquitetura de publicação automatizada de dados abertos conectados utilizando meta-dados e ontologias

Martins, Luiz Carlos Barbosa

Use este identificador para citar ou linkar para este item: http://repositorio.unb.br/handle/10482/34816

Arquivos associados a este item:

Arquivo	Descrição	Tamanho	Formato
2018_LuizCarlosBarbosaMartins.pdf		10,01 MB	Adobe PDF	Visualizar/Abrir

Título:	Proposta de arquitetura de publicação automatizada de dados abertos conectados utilizando meta-dados e ontologias
Autor(es):	Martins, Luiz Carlos Barbosa
Orientador(es):	Victorino, Marcio de Carvalho
Coorientador(es):	Holanda, Maristela Terto de
Assunto:	Dados abertos Metadados Web semântica Ontologia
Data de publicação:	13-Jun-2019
Data de defesa:	4-Dez-2018
Referência:	MARTINS, Luiz Carlos Barbosa. Proposta de arquitetura de publicação automatizada de dados abertos conectados utilizando meta-dados e ontologias. xiv, 80 f., il. Dissertação (Mestrado Profissional em Computação Aplicada)—Universidade de Brasília, Brasília, 2018.
Resumo:	O governo brasileiro tem investido no aumento da transparência de suas ações visando incentivar a participação ativa da sociedade na gestão. Neste sentido, uma das principais ações é a abertura dos dados de órgãos federais para a comunidade. Hoje existe uma quantidade considerável de dados abertos nos poderes Executivo, Legislativo e Judiciário, além das esferas da União, Estados ou Municípios, mas não existe uma maneira clara de realizar a conexão entre estes dados e a sua publicação. Esta pesquisa visa propor uma arquitetura que auxilie as instituições a abrir seus dados de maneira mais eficiente e agregue o máximo possível de qualidade a eles. A qualidade dos dados está relacionada a dois fatores: o dado ter possibilidade de ser ligado a outros dados e ser o mais atual possível. Assim, propomos um modelo que busca agregar diversas tecnologias que possibilitem que os dados possam ser descritos semanticamente, tornando assim dados conectados e viabilizando as ligações, além de propiciar que os conjuntos de dados possam ser atualizados sem a intervenção humana, garantindo intervalos reduzidos entre publicações. A arquitetura foi dividida em três camadas desacopladas, onde a origem do dado deve ficar a critério da entidade publicadora e o local da publicação final aos usuário final deve ser uma instância da plataforma CKAN. A camada intermediária entre extração dos dados e publicação é realizada pela solução desenvolvida pela pesquisa UnBGOLD que, através da definição de parâmetros específicos, realiza a indexação semântica do dados utilizando um vocabulário controlado, preferencialmente ontologias, e também publica automaticamente os dados no CKAN. Além disso, foi criado de um catálogo de conjuntos de dados também descritos de modo conectado e uma interface para realização de pesquisa pelos conjuntos de dados abertos em que a resposta é enriquecida semanticamente.
Abstract:	The Brazilian government has been investing in increasing the transparency of its actions aiming to encourage society to active participate in the country’s management. In this sense, one of the main actions is the opening of data from federal agencies to the community. Today there is a considerable amount of open data in the Executive, Legislative and Judicial branches, beyond the spheres of the Union, States or Municipalities, but there is no clear way to link this data with its publication. This research aims to propose an architecture that assists institutions to open their data more efficiently and to add as much quality as possible to them. The quality of the data is related to two factors: the data has the possibility of being linked to other data and be as current as possible. Thus we propose a model that seeks to aggregate several technologies that allow the data to be described semantically, thus making data linked and making connections possible, in addition to providing datasets that can be updated without human intervention, guaranteeing reduced intervals between publications. The architecture was divided into three decoupled layers, where the data origin should be at the discretion of the publisher and the final publication site to the final users must be an instance of the CKAN platform. The intermediate layer between data extraction and publication is performed by the solution developed by the UnBGOLD that, through the definition of specific parameters, performs the semantic indexing of the data using a controlled vocabulary, preferably ontologies, and also published automatically the data in the CKAN. Besides that, it was created from a catalog of datasets also described in connected mode and an interface for performing search by the open data sets in which the response is enriched semantically.
Unidade Acadêmica:	Instituto de Ciências Exatas (IE) Departamento de Ciência da Computação (IE CIC)
Informações adicionais:	Dissertação (mestrado)—Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, 2018.
Programa de pós-graduação:	Programa de Pós-Graduação em Computação Aplicada, Mestrado Profissional
Licença:	A concessão da licença deste item refere-se ao termo de autorização impresso assinado pelo autor com as seguintes condições: Na qualidade de titular dos direitos de autor da publicação, autorizo a Universidade de Brasília e o IBICT a disponibilizar por meio dos sites www.bce.unb.br, www.ibict.br, http://hercules.vtls.com/cgi-bin/ndltd/chameleon?lng=pt&skin=ndltd sem ressarcimento dos direitos autorais, de acordo com a Lei nº 9610/98, o texto integral da obra disponibilizada, conforme permissões assinaladas, para fins de leitura, impressão e/ou download, a título de divulgação da produção científica brasileira, a partir desta data.
Aparece nas coleções:	Teses, dissertações e produtos pós-doutorado

Mostrar registro completo do item Visualizar estatísticas