Campo DC | Valor | Idioma |
dc.contributor.advisor | Victorino, Marcio de Carvalho | pt_BR |
dc.contributor.author | Mercês, Marcella Guarnieri | pt_BR |
dc.date.accessioned | 2024-02-21T21:36:20Z | - |
dc.date.available | 2024-02-21T21:36:20Z | - |
dc.date.issued | 2024-02-21 | - |
dc.date.submitted | 2023-06-22 | - |
dc.identifier.citation | MERCÊS, Marcella Guarnieri. Predição de evasão de militares do Exército Brasileiro utilizando técnicas de machine learning. 2023. xiii, 74 f., il. Dissertação (Mestrado Profissional em Computação Aplicada) — Universidade de Brasília, Brasília, 2023. | pt_BR |
dc.identifier.uri | http://repositorio2.unb.br/jspui/handle/10482/47819 | - |
dc.description | Dissertação (mestrado) — Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, 2023. | pt_BR |
dc.description.abstract | Esse trabalho teve por objetivo realizar uma análise do quadro demissionário de oficiais
do Exército Brasileiro ao longo dos anos e propor um conjunto de técnicas que possibilitem identificar os oficiais com maior probabilidade de se tornarem demissionários, de
forma a permitir que o Exército aja proativamente a fim de evitar as perdas que esse ato
causa para a Força Terrestre. As abordagens escolhidas levaram em consideração as técnicas de aprendizado de máquina mais utilizadas para a predição de demissão voluntária
de empregados em empresas dos mais diversos ramos de atuação, como os algoritmos
de classificação K-nearest neighbors (KNN), árvores de decisão, random forest, gradient
boosting, extreme gradient boosting (XGBoost) e CatBoost. Também foram testadas a
utilização de técnicas de detecção de outliers e a utilização dos algoritmos de classificação
em conjunto com técnicas de reamostragem, combinando técnicas de undersampling com
técnicas de oversampling. O estudo de caso foi feito de acordo com o framework CRISPDM e utilizou dados de oficiais do Exército Brasileiro que ingressaram nessa Força entre
1990 e 2020. Todas as combinações de técnicas e algoritmos foram analisadas para o
conjunto de dados completo e para conjuntos de dados separados por carreiras.
Foi possível obter resultados de predição satisfatórios para o objetivo do estudo, com
uma predição superior à obtida através de um algoritmo que seleciona apenas a classe
mais comum. Três algoritmos utilizados no conjunto de dados completo obtiveram o
melhor resultado, sendo estatisticamente equivalente entre eles: XGBoost e CatBoost
com a realização de etapas de pré-processamento e CatBoost sem a realização de etapas
de pré-processamento. A separação por carreira não foi capaz de melhorar o resultado
da predição obtida com o conjunto de dados completo. Para a implantação, foi escolhido
o resultado do CatBoost sem as etapas de pré-processamento, por ser o mais rápido em
treinamento e mais simples em implementação entre os melhores resultados. Os atributos
com maior importância para essa classificação foram a quantidade de cursos, o tempo de
serviço e o tempo desde formado. | pt_BR |
dc.description.sponsorship | Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES). | pt_BR |
dc.language.iso | por | pt_BR |
dc.rights | Acesso Aberto | pt_BR |
dc.title | Predição de evasão de militares do Exército Brasileiro utilizando técnicas de machine learning | pt_BR |
dc.type | Dissertação | pt_BR |
dc.subject.keyword | Rotatividade de pessoal | pt_BR |
dc.subject.keyword | Exército brasileiro | pt_BR |
dc.subject.keyword | Aprendizagem de máquina | pt_BR |
dc.subject.keyword | Predição | pt_BR |
dc.rights.license | A concessão da licença deste item refere-se ao termo de autorização impresso assinado pelo autor com as seguintes condições: Na qualidade de titular dos direitos de autor da publicação, autorizo a Universidade de Brasília e o IBICT a disponibilizar por meio dos sites www.unb.br, www.ibict.br, www.ndltd.org sem ressarcimento dos direitos autorais, de acordo com a Lei nº 9610/98, o texto integral da obra supracitada, conforme permissões assinaladas, para fins de leitura, impressão e/ou download, a título de divulgação da produção científica brasileira, a partir desta data. | pt_BR |
dc.contributor.advisorco | Pinheiro, Wallace Anacleto | pt_BR |
dc.description.abstract1 | This research aims to analyze the turnover of Brazilian Army’s officers over the years
and propose a set of techniques that allow the identification of those officers more likely
to resign. This result can help the Brazilian Army to act so that these resignations
have a lesser impact in it’s productivity. The approaches chosen considered the most
common techniques used to predict employee churn in other areas. Common classification
algorithms, such as K-nearest neighbors (KNN), decision trees, random forest, gradient
boosting, extreme gradient boosting (XGBoost), and CatBoost, were used. Techniques to
detect outliers in the dataset were also tested, as well as resampling techniques with the
combination of both undersampling and oversampling algorithms. The case study used
the framework CRISP-DM. The chosen data set had the data of all officers that entered
the Brazilian Army between 1990 and 2020. All techniques and algorithms combinations
were tested for both the whole data set and for data sets divided by the different careers
officers can have.
Satisfactory results were achieved by obtaining a model that is better at predicting
turnover than an algorithm that always classifies all elements as the majority class. In fact,
three of the models obtained presented the best results, with all three being statistically
equivalent to each other: XGBoost and CatBoost combined with data pre-processing and
CatBoost without any data pre-processing. Dividing the data by career did not improve
the results obtained with the whole data set. For the implantation part of CRISP-DM the
model generated with CatBoost without data pre-processing was chosen, since it is the
one that has faster training and simpler code among the three best. It was also possible to
discover that the attributes with the highest importance to the classification were number
of courses, time since joining the Army and time since graduating. | pt_BR |
dc.description.unidade | Instituto de Ciências Exatas (IE) | pt_BR |
dc.description.unidade | Departamento de Ciência da Computação (IE CIC) | pt_BR |
dc.description.ppg | Programa de Pós-Graduação em Computação Aplicada, Mestrado Profissional | pt_BR |
Aparece nas coleções: | Teses, dissertações e produtos pós-doutorado
|