http://repositorio.unb.br/handle/10482/44831
Arquivo | Descrição | Tamanho | Formato | |
---|---|---|---|---|
2022_VictorDamiãoGontijoMourão.pdf | 859,87 kB | Adobe PDF | Visualizar/Abrir |
Título: | Estudo comparativo entre técnicas de machine learning para classificação do tomador PJ – MPE (Micro e Pequenas Empresas) |
Autor(es): | Mourão, Victor Damião Gontijo |
Orientador(es): | Cajueiro, Daniel Oliveira |
Assunto: | Aprendizagem de máquina Aprendizado supervisionado de máquina Risco de crédito |
Data de publicação: | 15-Set-2022 |
Data de defesa: | 30-Mai-2022 |
Referência: | MOURÃO, Victor Damião Gontijo. Estudo comparativo entre técnicas de machine learning para classificação do tomador PJ – MPE (Micro e Pequenas Empresas). 2022. 44 f., il. Dissertação (Mestrado em Economia) — Universidade de Brasília, Brasília, 2022. |
Resumo: | A literatura tem mostrado que as técnicas de machine learning são bastante adequadas no contexto de risco de crédito e muitos pesquisadores têm obtido bons resultados para previsão da inadimplência. Nesse sentido, esta dissertação teve como objetivo a realização de um estudo empírico, utilizando métodos de aprendizado supervisionado para a classificação de tomadores de crédito. O trabalho foi desenvolvido a partir de uma base de dados real, fornecida por um dos maiores bancos do Brasil, com informações de micro e pequenas empresas contratantes de empréstimos no ano de 2020, período em que a pandemia da COVID-19 impactava o cenário econômico. Utilizamos 3 técnicas de machine learning: Regressão Logística, Random Forest e Gradient Boosting. E para aumentar o desempenho dos algoritmos, diante de uma base de dados desbalanceada, utilizamos 3 técnicas de balanceamento: NearMiss, SMOTE - Synthetic Minority Over-sampling Technique e SMOTEENN - combinação do SMOTE com ENN - Edited Nearest Neighbours. Como medida de sucesso, buscamos o aumento da AUC - Área Sob a Curva ROC, e, de acordo com os resultados, o algoritmo que apresentou maior AUC foi o Random Forest com o balanceamento SMOTE, atingindo resultado de 79,16%, e a menor AUC foi do algoritmo Regressão Logística sem o balanceamento da base de treino, atingindo resultado de 67,99%. |
Abstract: | The literature has shown that machine learning techniques are quite suitable in the context of credit risk and many researchers have obtained good results for default prediction. In this sense, this dissertation aimed to carry out an empirical study, using supervised learning methods to classify borrowers. The work was developed from a real database, provided by one of the largest banks in Brazil, with information on micro and small companies contracting loans in 2020, a period in which the COVID-19 pandemic impacted the economic scenario. We used three machine learning techniques: Logistic Regression, Random Forest and Gradient Boosting. And to increase the performance of the algorithms, in front of an unbalanced database, we used three balancing techniques: NearMiss, SMOTE - Synthetic Minority Over-sampling Technique and SMOTEENN - combination of SMOTE with ENN - Edited Nearest Neighbors. As a measure of success, we sought to increase the AUC - Area Under the ROC Curve, and, according to the results, the algorithm that presented the highest AUC was Random Forest with SMOTE balance, reaching a result of 79.16%, and the lowest AUC was from the Logistic Regression algorithm without balancing the training base, reaching a result of 67.99%. |
Unidade Acadêmica: | Faculdade de Economia, Administração, Contabilidade e Gestão de Políticas Públicas (FACE) Departamento de Economia (FACE ECO) |
Informações adicionais: | Dissertação (mestrado) — Universidade de Brasília, Faculdade de Economia, Administração e Contabilidade, Departamento de Economia, Programa de Pós-Graduação em Ciências Econômicas, 2022. |
Programa de pós-graduação: | Programa de Pós-Graduação em Economia |
Licença: | A concessão da licença deste item refere-se ao termo de autorização impresso assinado pelo autor com as seguintes condições: Na qualidade de titular dos direitos de autor da publicação, autorizo a Universidade de Brasília e o IBICT a disponibilizar por meio dos sites www.bce.unb.br, www.ibict.br, http://hercules.vtls.com/cgi-bin/ndltd/chameleon?lng=pt&skin=ndltd sem ressarcimento dos direitos autorais, de acordo com a Lei nº 9610/98, o texto integral da obra disponibilizada, conforme permissões assinaladas, para fins de leitura, impressão e/ou download, a título de divulgação da produção científica brasileira, a partir desta data. |
Aparece nas coleções: | Teses, dissertações e produtos pós-doutorado |
Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.