http://repositorio.unb.br/handle/10482/37487
Arquivo | Descrição | Tamanho | Formato | |
---|---|---|---|---|
2019_UriasCruzdaCunha.pdf | 10,07 MB | Adobe PDF | Visualizar/Abrir |
Título: | Utilização de técnicas de aprendizagem de máquina nos pagamentos de cobertura do Proagro |
Autor(es): | Cunha, Urias Cruz da |
E-mail do autor: | uriascruz@gmail.com |
Orientador(es): | Zaghetto, Alexandre |
Assunto: | Produtores rurais Seguro agrícola Programa de Garantia da Atividade Agropecuária (Proagro) Aprendizagem de máquina |
Data de publicação: | 15-Abr-2020 |
Data de defesa: | 25-Jul-2019 |
Referência: | CUNHA, Urias Cruz da. Utilização de técnicas de aprendizagem de máquina nos pagamentos de cobertura do Proagro. 2019. xvii, 124 f., il. Dissertação (Mestrado Profissional em Computação Aplicada)—Universidade de Brasília, Brasília, 2019. |
Resumo: | O seguro agrícola é um instrumento efetivo de proteção de investimentos de produtores rurais contra as perdas decorrentes dos perigos naturais do campo. Como forma de oferecer um seguro para proteção do capital investido no empreendimento agrícola, o governo brasileiro criou o Programa de Garantia da Atividade Agropecuária (Proagro). Desde sua criação, coube ao Banco Central do Brasil a administração e supervisão do programa, enquanto às instituições financeiras coube a sua operação. Para tornar as ações da supervisão mais efetivas, foi estabelecida uma área de monitoramento cujo objetivo é gerar alertas para a supervisão trazendo possíveis casos de irregularidades. A fim de otimizar o uso dos dados adotados na geração de sinalizações, foi proposta a construção de um classificador, por meio do emprego de algoritmos e técnicas de aprendizagem de máquina, capaz de distinguir as comunicações de ocorrência de perda procedentes das improcedentes. Utilizando o modelo de referência CRISP-DM, foram executadas atividades das etapas que vão desde a preparação dos dados até a modelagem. Na modelagem, foram aplicados os algoritmos Support Vector Machine, Naive Bayes, Redes Neurais Artificiais e Random Forest. Ao final da modelagem, obteve-se, com o algoritmo Random Forest, um modelo vencedor com precisão média de 0,550 nos dados de teste. A partir da análise da curva precisão-sensibilidade, verifica-se que o modelo vencedor deve alcançar uma precisão de 80% para uma sensibilidade de 30%. Além do modelo classificatório, como resultado do trabalho teve-se a criação de scripts de captura automática de dados dos sistemas Agritempo e Sisdagro, o que deverá proporcionar ganhos de quantidade, tempestividade e qualidade nas análises das comunicações de ocorrência de perda. |
Abstract: | Crop insurance is an effective mechanism which aims to protect farmers investments against loss resulting from natural hazards. As a way of providing insurance for protection for capital invested in agricultural ventures, the Brazilian government created the Program of Guarantee of the Agricultural Activity (PROAGRO). Since its creation, it has been the duty of the Central Bank of Brazil to administer and oversee the program whereas the operation has been delegated to the financial institutions authorized to work with the program. In order to make the oversight actions more effective, a monitoring division was established whose goal is to generate alerts to the oversight team with likely irregular insurance claims. To optimize the use of data applied to the generation of alerts, we proposed the implementation of a classifier using machine learning techniques. The classifier should be capable of distinguishing normal and irregular insurance claims. Following the CRISP-DM reference model, we carried out a series of activities since data preparation until modeling. In the modeling phase, we applied Support Vector Machine, Naive Bayes, Artificial Neural Networks, and Random Forest algorithms. At the end of the modeling phase, we obtained a model generated by Random Forest which achieved an average precision of 0.550 on the test dataset. With this model, it is possible to achieve a precision of 80% while keeping the sensitivity at 30%. In addition to this, this research produced scripts that will allow automatic data collection of Agritempo and Sisdagro systems, which will provide gains in volume, timeliness, and quality for the insurance claims analyses. |
Unidade Acadêmica: | Instituto de Ciências Exatas (IE) Departamento de Ciência da Computação (IE CIC) |
Informações adicionais: | Dissertação (mestrado)—Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, 2019. |
Programa de pós-graduação: | Programa de Pós-Graduação em Computação Aplicada, Mestrado Profissional |
Licença: | A concessão da licença deste item refere-se ao termo de autorização impresso assinado pelo autor com as seguintes condições: Na qualidade de titular dos direitos de autor da publicação, autorizo a Universidade de Brasília e o IBICT a disponibilizar por meio dos sites www.bce.unb.br, www.ibict.br, http://hercules.vtls.com/cgi-bin/ndltd/chameleon?lng=pt&skin=ndltd sem ressarcimento dos direitos autorais, de acordo com a Lei nº 9610/98, o texto integral da obra disponibilizada, conforme permissões assinaladas, para fins de leitura, impressão e/ou download, a título de divulgação da produção científica brasileira, a partir desta data. |
Agência financiadora: | Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES). |
Aparece nas coleções: | Teses, dissertações e produtos pós-doutorado |
Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.