Campo DC | Valor | Idioma |
dc.contributor.advisor | Chaim, Ricardo Matos | - |
dc.contributor.author | Vasconcelos, Marcelo Oliveira | - |
dc.date.accessioned | 2021-12-07T13:17:30Z | - |
dc.date.available | 2021-12-07T13:17:30Z | - |
dc.date.issued | 2021-12-07 | - |
dc.date.submitted | 2021-06-30 | - |
dc.identifier.citation | VASCONCELOS, Marcelo Oliveira. Modelos preditivos para avaliação de risco de corrupção de servidores públicos do Distrito Federal. 2021. 72 f., il. Dissertação (Mestrado Profissional em Computação Aplicada)—Universidade de Brasília, Brasília, 2021. | pt_BR |
dc.identifier.uri | https://repositorio.unb.br/handle/10482/42537 | - |
dc.description | Dissertação (mestrado)—Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, 2021. | pt_BR |
dc.description.abstract | A pesquisa tratou de elaboração de um modelo preditivo para avaliação de risco de corrupção
de servidores públicos do Distrito Federal, nos termos da Lei no 8.429/92, com auxílio da
literatura acadêmica para identificação de atributos e definição de algoritmos de aprendizagem
de máquina para aplicação na fiscalização do Tribunal de Contas do Distrito Federal (TCDF),
para isso levantou-se a literatura acadêmica dos fatores de risco e das técnicas de aprendizagem
de máquina relacionadas à corrupção e com auxílio de especialistas, seguindo o método CRISP-
DM como referência, iniciou-se o processo de mineração com integração de oito bases de dados
com seleção de atributos, limpeza, transformação, análise de variância e de correlação,
separação de dados e modelagem. O algoritmo utilizado foi regressão logística e uma das
dificuldades da investigação foi o desbalanceamento extremo de classes a razão de 1:707 ou
em termos percentuais 0,14% da classe de interesse em relação a população. Para solução foram
utilizadas duas possíveis abordagens, balanceamento com técnicas de reamostragem com uso
de synthetic minority oversampling technique SMOTE e aplicação de algoritmos com
características específicas de parametrização para obter os padrões desejados da classe
minoritária de forma a evitar viés da classe dominante. O melhor resultado de modelagem
ocorreu com a aplicação da técnica de pesos gerando valor de área sobre a curva ROC de 0,7,
definição de sessenta e oito atributos e seus respectivos coeficientes que correspondem aos
fatores de risco de corrupção. O resultado dessa pesquisa foi a identificação dos fatores de risco
de corrupção dos servidores do GDF a partir do modelo gerado para que com esses parâmetros
possa auxiliar na definição de planejamento de fiscalização do TCDF com otimização de
recursos (pessoal e equipamentos) e foco nas atividades de maior risco para Administração
Pública. Como a melhoria futura a este trabalho, será a inclusão de atributos do sistema de
compras governamentais do GDF (Ecompras) que está previsto para operar em meados de 2021. | pt_BR |
dc.language.iso | Português | pt_BR |
dc.rights | Acesso Aberto | pt_BR |
dc.title | Modelos preditivos para avaliação de risco de corrupção de servidores públicos do Distrito Federal | pt_BR |
dc.type | Dissertação | pt_BR |
dc.subject.keyword | Corrupção | pt_BR |
dc.subject.keyword | Servidores públicos - corrupção | pt_BR |
dc.subject.keyword | Mineração de dados | pt_BR |
dc.subject.keyword | Riscos de corrupção | pt_BR |
dc.rights.license | A concessão da licença deste item refere-se ao termo de autorização impresso assinado pelo autor com as seguintes condições: Na qualidade de titular dos direitos de autor da publicação, autorizo a Universidade de Brasília e o IBICT a disponibilizar por meio dos sites www.bce.unb.br, www.ibict.br, http://hercules.vtls.com/cgi-bin/ndltd/chameleon?lng=pt&skin=ndltd sem ressarcimento dos direitos autorais, de acordo com a Lei nº 9610/98, o texto integral da obra disponibilizada, conforme permissões assinaladas, para fins de leitura, impressão e/ou download, a título de divulgação da produção científica brasileira, a partir desta data. | pt_BR |
dc.description.abstract1 | The research aims to create a predictive model for the assessment of the risk of corruption of
public servants in the Federal District, under the terms of Law No. 8,429/92, by using academic
literature to identify attributes and define machine learning algorithms to be applied in the
inspection of the Federal District Court of Auditors (TCDF), for this purpose the academic
literature on risk factors and machine learning techniques related to corruption was raised and
with the help of specialists and following the CRISP-DM method as a reference, the data mining
process began with the integration of eight databases with the features selection, creation of a
dataset, cleaning, transforming, and modeling. The algorithm used was logistic regression, and
one of the difficulties of the investigation was the extreme imbalance of classes at a ratio of
1:707 or, in percentage terms, 0.14% of the interest class to the population. For solution, two
possible approaches were used, balancing with resampling techniques using synthetic minority
oversampling technique SMOTE or applying algorithms with specific parameterization
characteristics to obtain the desired standards of the minority class without generating bias from
the dominant class. Finally, the best modeling result was obtained by applying the weights
technique, generating an area value on the ROC curve of 0.7, defining sixty-eight features and
their respective coefficients that correspond to the risk factors for corruption. The result of this
research aimed to identify the risk factors of corruption of the civil servants of the GDF so that
these parameters can assist in the definition of overseen planning of the TCDF with
optimization of resources (personnel and equipment) and focus on the activities of greatest risk
for Public Administration, that is, cases that have a high probability of occurrence and a high
financial or social impact. A future improvement to this work includes features of the GDF
government procurement system (Ecompras) that is expected to operate in 2021. | pt_BR |
dc.description.unidade | Instituto de Ciências Exatas (IE) | pt_BR |
dc.description.unidade | Departamento de Ciência da Computação (IE CIC) | pt_BR |
dc.description.ppg | Programa de Pós-Graduação em Computação Aplicada, Mestrado Profissional | pt_BR |
Aparece nas coleções: | Teses, dissertações e produtos pós-doutorado
|