http://repositorio.unb.br/handle/10482/42537
Fichero | Descripción | Tamaño | Formato | |
---|---|---|---|---|
2021_MarceloOliveiraVasconcelos.pdf | 1,64 MB | Adobe PDF | Visualizar/Abrir |
Título : | Modelos preditivos para avaliação de risco de corrupção de servidores públicos do Distrito Federal |
Autor : | Vasconcelos, Marcelo Oliveira |
Orientador(es):: | Chaim, Ricardo Matos |
Assunto:: | Corrupção Servidores públicos - corrupção Mineração de dados Riscos de corrupção |
Fecha de publicación : | 7-dic-2021 |
Data de defesa:: | 30-jun-2021 |
Citación : | VASCONCELOS, Marcelo Oliveira. Modelos preditivos para avaliação de risco de corrupção de servidores públicos do Distrito Federal. 2021. 72 f., il. Dissertação (Mestrado Profissional em Computação Aplicada)—Universidade de Brasília, Brasília, 2021. |
Resumen : | A pesquisa tratou de elaboração de um modelo preditivo para avaliação de risco de corrupção de servidores públicos do Distrito Federal, nos termos da Lei no 8.429/92, com auxílio da literatura acadêmica para identificação de atributos e definição de algoritmos de aprendizagem de máquina para aplicação na fiscalização do Tribunal de Contas do Distrito Federal (TCDF), para isso levantou-se a literatura acadêmica dos fatores de risco e das técnicas de aprendizagem de máquina relacionadas à corrupção e com auxílio de especialistas, seguindo o método CRISP- DM como referência, iniciou-se o processo de mineração com integração de oito bases de dados com seleção de atributos, limpeza, transformação, análise de variância e de correlação, separação de dados e modelagem. O algoritmo utilizado foi regressão logística e uma das dificuldades da investigação foi o desbalanceamento extremo de classes a razão de 1:707 ou em termos percentuais 0,14% da classe de interesse em relação a população. Para solução foram utilizadas duas possíveis abordagens, balanceamento com técnicas de reamostragem com uso de synthetic minority oversampling technique SMOTE e aplicação de algoritmos com características específicas de parametrização para obter os padrões desejados da classe minoritária de forma a evitar viés da classe dominante. O melhor resultado de modelagem ocorreu com a aplicação da técnica de pesos gerando valor de área sobre a curva ROC de 0,7, definição de sessenta e oito atributos e seus respectivos coeficientes que correspondem aos fatores de risco de corrupção. O resultado dessa pesquisa foi a identificação dos fatores de risco de corrupção dos servidores do GDF a partir do modelo gerado para que com esses parâmetros possa auxiliar na definição de planejamento de fiscalização do TCDF com otimização de recursos (pessoal e equipamentos) e foco nas atividades de maior risco para Administração Pública. Como a melhoria futura a este trabalho, será a inclusão de atributos do sistema de compras governamentais do GDF (Ecompras) que está previsto para operar em meados de 2021. |
Abstract: | The research aims to create a predictive model for the assessment of the risk of corruption of public servants in the Federal District, under the terms of Law No. 8,429/92, by using academic literature to identify attributes and define machine learning algorithms to be applied in the inspection of the Federal District Court of Auditors (TCDF), for this purpose the academic literature on risk factors and machine learning techniques related to corruption was raised and with the help of specialists and following the CRISP-DM method as a reference, the data mining process began with the integration of eight databases with the features selection, creation of a dataset, cleaning, transforming, and modeling. The algorithm used was logistic regression, and one of the difficulties of the investigation was the extreme imbalance of classes at a ratio of 1:707 or, in percentage terms, 0.14% of the interest class to the population. For solution, two possible approaches were used, balancing with resampling techniques using synthetic minority oversampling technique SMOTE or applying algorithms with specific parameterization characteristics to obtain the desired standards of the minority class without generating bias from the dominant class. Finally, the best modeling result was obtained by applying the weights technique, generating an area value on the ROC curve of 0.7, defining sixty-eight features and their respective coefficients that correspond to the risk factors for corruption. The result of this research aimed to identify the risk factors of corruption of the civil servants of the GDF so that these parameters can assist in the definition of overseen planning of the TCDF with optimization of resources (personnel and equipment) and focus on the activities of greatest risk for Public Administration, that is, cases that have a high probability of occurrence and a high financial or social impact. A future improvement to this work includes features of the GDF government procurement system (Ecompras) that is expected to operate in 2021. |
metadata.dc.description.unidade: | Instituto de Ciências Exatas (IE) Departamento de Ciência da Computação (IE CIC) |
Descripción : | Dissertação (mestrado)—Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, 2021. |
metadata.dc.description.ppg: | Programa de Pós-Graduação em Computação Aplicada, Mestrado Profissional |
Licença:: | A concessão da licença deste item refere-se ao termo de autorização impresso assinado pelo autor com as seguintes condições: Na qualidade de titular dos direitos de autor da publicação, autorizo a Universidade de Brasília e o IBICT a disponibilizar por meio dos sites www.bce.unb.br, www.ibict.br, http://hercules.vtls.com/cgi-bin/ndltd/chameleon?lng=pt&skin=ndltd sem ressarcimento dos direitos autorais, de acordo com a Lei nº 9610/98, o texto integral da obra disponibilizada, conforme permissões assinaladas, para fins de leitura, impressão e/ou download, a título de divulgação da produção científica brasileira, a partir desta data. |
Aparece en las colecciones: | Teses, dissertações e produtos pós-doutorado |
Los ítems de DSpace están protegidos por copyright, con todos los derechos reservados, a menos que se indique lo contrario.