http://repositorio.unb.br/handle/10482/48384
Arquivo | Descrição | Tamanho | Formato | |
---|---|---|---|---|
LeticiaMoreiraValle_TESE.pdf | 1,4 MB | Adobe PDF | Visualizar/Abrir |
Título: | A new machine learning based framework to classify and analyze industry-specific regulations |
Autor(es): | Valle, Letícia Moreira |
Orientador(es): | Dias, Ugo Silva |
Assunto: | Aprendizagem de máquina Transparência governamental Métricas de regulação Classificação de texto |
Data de publicação: | 24-Jun-2024 |
Data de defesa: | 9-Mai-2023 |
Referência: | VALLE, Letícia Moreira. A new machine learning based framework to classify and analyze industry-specific regulation. 2023. 90 f., il. Tese (Doutorado em Engenharia Elétrica) — Universidade de Brasília, Brasília, 2023. |
Resumo: | A transparência e abertura do governo são elementos cruciais no avanço da modernização do estado. A combinação entre transparência e informação digital deu origem ao conceito de Governo Aberto, que aumenta o entendimento do cidadão sobre processos governamentais e como consequência o monitoramento das ações do governo, o que, por sua vez, melhora a qualidade dos serviços públicos e do processo decisório governamental. Com o objetivo de melhorar a transparência legislativa e a compreensão do processo regulatório brasileiro e suas características, este estudo apresenta o RegBR, a primeira estrutura nacional projetada para centralizar, classificar e analisar as regulamentações do governo brasileiro. O RegBR emprega rotinas de ETL automatizadas e técnicas de mineração de dados e aprendizado de máquina para construir um banco de dados centralizado da legislação federal brasileira. A estrutura avalia vários modelos de processamento de linguagem natural (NLP) em uma tarefa de classificação de texto em um novo corpus jurídico português e realiza análises regulatórias com base em métricas que dizem respeito à complexidade linguística, restritividade, popularidade e relevância de citação específica dos setores da economia. Este estudo propõe e apresenta métricas que podem ser usadas pelos formuladores de políticas para avaliar seu próprio trabalho, aumentando assim a abertura e a transparência do processo público, além de facilitar novas pesquisas na área de impacto regulatório brasileiro. De acordo com os dados do Google Analytics, as paginas contendo a métrica de popularidade e o fluxo regulatório são a quarta e a quinta páginas mais visitadas no site Infogov, respectivamente, indicando interesse significativo nas informações disponibilizadas pela RegBR. Especificamente, essas duas páginas sozinhas receberam mais de 800 visualizações únicas nos dois primeiros meses de 2023. |
Abstract: | Government transparency and openness are crucial elements in advancing the modernization of the state. The combination of transparency and digital information has given rise to the concept of Open Government, which increases citizen understanding and monitoring of government actions, improving the quality of public services and the government decision making process. To enhance legislative transparency and comprehension of the Brazilian regulatory process and its characteristics, this study introduces RegBR, the first national framework designed to centralize, classify, and analyze regulations from the Brazilian government. RegBR employs automated ETL routines, data mining and machine learning techniques to construct a centralized database of Brazilian federal legislation. The framework evaluates various natural language processing (NLP) models in a text classification task on a novel Portuguese legal corpus and conducts regulatory analysis based on metrics that pertain to linguistic complexity, restrictiveness, popularity, and industry-specific citation relevance. This study proposes and presents metrics policymakers can use to assess their own work, thereby increasing the openness and transparency of the public process while also facilitating new research in the area of Brazilian regulatory impact. According to Google Analytics data, the popularity metric and the regulatory flow pages rank as the fourth and fifth most visited web pages in the Infogov website, respectively, indicating significant interest in the information made available by RegBR. Specifically, these two pages alone received over 800 unique views within the first two months of 2023. |
Unidade Acadêmica: | Faculdade de Tecnologia (FT) Departamento de Engenharia Elétrica (FT ENE) |
Informações adicionais: | Tese (doutorado) — Universidade de Brasília, Faculdade de Tecnologia, Departamento de Engenharia Elétrica, 2023. |
Programa de pós-graduação: | Programa de Pós-Graduação em Engenharia Elétrica |
Licença: | A concessão da licença deste item refere-se ao termo de autorização impresso assinado pelo autor com as seguintes condições: Na qualidade de titular dos direitos de autor da publicação, autorizo a Universidade de Brasília e o IBICT a disponibilizar por meio dos sites www.bce.unb.br, www.ibict.br, http://hercules.vtls.com/cgi-bin/ndltd/chameleon?lng=pt&skin=ndltd sem ressarcimento dos direitos autorais, de acordo com a Lei nº 9610/98, o texto integral da obra disponibilizada, conforme permissões assinaladas, para fins de leitura, impressão e/ou download, a título de divulgação da produção científica brasileira, a partir desta data. |
Agência financiadora: | Escola Nacional de Administração Pública (ENAP) |
Aparece nas coleções: | Teses, dissertações e produtos pós-doutorado |
Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.