Inferência de similaridade de sentenças judiciais na Justiça do Trabalho

Bispo, Guilherme Dantas

Please use this identifier to cite or link to this item: http://repositorio.unb.br/handle/10482/43690

Files in This Item:

File	Description	Size	Format
2022_GuilhermeDantasBispo.pdf		2,89 MB	Adobe PDF	View/Open

Title:	Inferência de similaridade de sentenças judiciais na Justiça do Trabalho
Authors:	Bispo, Guilherme Dantas
Orientador(es)::	Ladeira, Marcelo
Assunto::	Recuperação de informação Similaridade de documentos Documentos jurídicos
Issue Date:	12-May-2022
Data de defesa::	15-Dec-2021
Citation:	BISPO, Guilherme Dantas. Inferência de similaridade de sentenças judiciais na Justiça do Trabalho. 2021. xiii, 57 f., il. Dissertação (Mestrado Profissional em Computação Aplicada) — Universidade de Brasília, Brasília, 2021.
Abstract:	Esse trabalho propõe um aperfeiçoamento da funcionalidade de minutar e analisar sentenças do sistema Processo Judicial Eletrônico (PJe) da Justiça do Trabalho permitindo ao magistrado uma pesquisa mais refinada de sentenças similares demonstrando, inclusive, o percentual de similaridade das sentenças encontradas com o processo em questão. Para viabilizar a pesquisa são utilizadas técnicas de mineração de texto para identificar similaridades de sentenças na Justiça do Trabalho. Inicialmente, a performance de modelos induzidos via técnica sintáticas e modelos induzidos via técnicas semânticas é avaliada. Para avaliação são considerados três algoritmos: LDA, Doc2Vec e BM25. Os algoritmos são treinados e avaliados com as sentenças do Tribunal Regional do Trabalho da 10ª Região. Baseado nas métricas de P@K e nDCG, o algoritmo BM25 apresentou o melhor desempenho se comparado aos outros algoritmos de análise sintática e, também, de análise semântica. Para a avaliação, foram escolhidos cinco temas do Direito do Trabalho e para cada tema foram elaboradas duas queries de pesquisa. As queries foram submetidas aos modelos e posteriormente as primeiras 25 sentenças de maior similaridade encontradas foram avaliadas por especialista de negócio levando em consideração a sua relevância. Nesse experimento o BM25 teve 0.8019 como média para índice nDCG, um resultado quase 20% superior ao segundo colocado (LDA250). Após a avaliação, o modelo que usa o BM25 foi integrado a funcionalidade de minutar e analisar sentenças do Processo Judicial Eletrônico (PJe) permitindo aos usuários identificarem de forma fácil quais são as sentenças similares do caso em questão. A solução proposta é uma alternativa de pesquisa durante a elaboração de uma nova sentença permitindo o reaproveitamento de algum texto já desenvolvido em um caso similar anterior, se assim o magistrado desejar.
Abstract:	This work proposes an improvement in the functionality of drafting and analyzing sentences of the Electronic Judicial Process (PJe) system of the Labor Court, allowing the magistrate a more refined search for similar sentences, even demonstrating the percentage of similarity of the sentences found with the process in question . To make the research feasible, text mining techniques are used to identify similarities of sentences in the Labor Court. Initially, the performance of models induced via syntactic techniques and models induced via semantic techniques is evaluated. Three algorithms are considered for evaluation: LDA, Doc2Vec and BM25. The algorithms are trained and evaluated with the judgments of the Regional Labor Court of the 10th Region. Based on P@K and nDCG metrics, the BM25 algorithm showed the best performance when compared to other parsing and semantic analysis algorithms. For the evaluation, five themes were chosen and for each theme two research queries were elaborated. The queries were submitted to the models and the first 25 sentences with the greatest similarity found were evaluated by a business expert taking into account their relevance. In this experiment, the BM25 had 0.8019 as an average for the nDCG index, a result 20% higher than the second place (LDA250). After the evaluation, the model that uses the BM25 was integrated with the functionality to draft and analyze sentences of the Electronic Judicial Process (PJe) allowing users to easily identify which are the similar sentences in the case in question. The proposed solution is a research alternative during the elaboration of a new sentence, allowing the reuse of some text already developed in a previous similar case, if desired by the magistrate.
metadata.dc.description.unidade:	Instituto de Ciências Exatas (IE) Departamento de Ciência da Computação (IE CIC)
Description:	Dissertação (Mestrado Profissional em Computação Aplicada) — Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, Brasília, 2021.
metadata.dc.description.ppg:	Programa de Pós-Graduação em Computação Aplicada, Mestrado Profissional
Licença::	A concessão da licença deste item refere-se ao termo de autorização impresso assinado pelo autor com as seguintes condições: Na qualidade de titular dos direitos de autor da publicação, autorizo a Universidade de Brasília e o IBICT a disponibilizar por meio dos sites www.bce.unb.br, www.ibict.br, http://hercules.vtls.com/cgi-bin/ndltd/chameleon?lng=pt&skin=ndltd sem ressarcimento dos direitos autorais, de acordo com a Lei nº 9610/98, o texto integral da obra disponibilizada, conforme permissões assinaladas, para fins de leitura, impressão e/ou download, a título de divulgação da produção científica brasileira, a partir desta data.
Appears in Collections:	Teses, dissertações e produtos pós-doutorado

Show full item record " class="statisticsLink btn btn-primary" href="/jspui/handle/10482/43690/statistics">