Inferência de similaridade de sentenças judiciais na Justiça do Trabalho

Bispo, Guilherme Dantas

Registro completo de metadados

Campo DC	Valor	Idioma
dc.contributor.advisor	Ladeira, Marcelo	-
dc.contributor.author	Bispo, Guilherme Dantas	-
dc.date.accessioned	2022-05-12T17:54:49Z	-
dc.date.available	2022-05-12T17:54:49Z	-
dc.date.issued	2022-05-12	-
dc.date.submitted	2021-12-15	-
dc.identifier.citation	BISPO, Guilherme Dantas. Inferência de similaridade de sentenças judiciais na Justiça do Trabalho. 2021. xiii, 57 f., il. Dissertação (Mestrado Profissional em Computação Aplicada) — Universidade de Brasília, Brasília, 2021.	pt_BR
dc.identifier.uri	https://repositorio.unb.br/handle/10482/43690	-
dc.description	Dissertação (Mestrado Profissional em Computação Aplicada) — Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, Brasília, 2021.	pt_BR
dc.description.abstract	Esse trabalho propõe um aperfeiçoamento da funcionalidade de minutar e analisar sentenças do sistema Processo Judicial Eletrônico (PJe) da Justiça do Trabalho permitindo ao magistrado uma pesquisa mais refinada de sentenças similares demonstrando, inclusive, o percentual de similaridade das sentenças encontradas com o processo em questão. Para viabilizar a pesquisa são utilizadas técnicas de mineração de texto para identificar similaridades de sentenças na Justiça do Trabalho. Inicialmente, a performance de modelos induzidos via técnica sintáticas e modelos induzidos via técnicas semânticas é avaliada. Para avaliação são considerados três algoritmos: LDA, Doc2Vec e BM25. Os algoritmos são treinados e avaliados com as sentenças do Tribunal Regional do Trabalho da 10ª Região. Baseado nas métricas de P@K e nDCG, o algoritmo BM25 apresentou o melhor desempenho se comparado aos outros algoritmos de análise sintática e, também, de análise semântica. Para a avaliação, foram escolhidos cinco temas do Direito do Trabalho e para cada tema foram elaboradas duas queries de pesquisa. As queries foram submetidas aos modelos e posteriormente as primeiras 25 sentenças de maior similaridade encontradas foram avaliadas por especialista de negócio levando em consideração a sua relevância. Nesse experimento o BM25 teve 0.8019 como média para índice nDCG, um resultado quase 20% superior ao segundo colocado (LDA250). Após a avaliação, o modelo que usa o BM25 foi integrado a funcionalidade de minutar e analisar sentenças do Processo Judicial Eletrônico (PJe) permitindo aos usuários identificarem de forma fácil quais são as sentenças similares do caso em questão. A solução proposta é uma alternativa de pesquisa durante a elaboração de uma nova sentença permitindo o reaproveitamento de algum texto já desenvolvido em um caso similar anterior, se assim o magistrado desejar.	pt_BR
dc.language.iso	Português	pt_BR
dc.rights	Acesso Aberto	pt_BR
dc.title	Inferência de similaridade de sentenças judiciais na Justiça do Trabalho	pt_BR
dc.type	Dissertação	pt_BR
dc.subject.keyword	Recuperação de informação	pt_BR
dc.subject.keyword	Similaridade de documentos	pt_BR
dc.subject.keyword	Documentos jurídicos	pt_BR
dc.rights.license	A concessão da licença deste item refere-se ao termo de autorização impresso assinado pelo autor com as seguintes condições: Na qualidade de titular dos direitos de autor da publicação, autorizo a Universidade de Brasília e o IBICT a disponibilizar por meio dos sites www.bce.unb.br, www.ibict.br, http://hercules.vtls.com/cgi-bin/ndltd/chameleon?lng=pt&skin=ndltd sem ressarcimento dos direitos autorais, de acordo com a Lei nº 9610/98, o texto integral da obra disponibilizada, conforme permissões assinaladas, para fins de leitura, impressão e/ou download, a título de divulgação da produção científica brasileira, a partir desta data.	pt_BR
dc.description.abstract1	This work proposes an improvement in the functionality of drafting and analyzing sentences of the Electronic Judicial Process (PJe) system of the Labor Court, allowing the magistrate a more refined search for similar sentences, even demonstrating the percentage of similarity of the sentences found with the process in question . To make the research feasible, text mining techniques are used to identify similarities of sentences in the Labor Court. Initially, the performance of models induced via syntactic techniques and models induced via semantic techniques is evaluated. Three algorithms are considered for evaluation: LDA, Doc2Vec and BM25. The algorithms are trained and evaluated with the judgments of the Regional Labor Court of the 10th Region. Based on P@K and nDCG metrics, the BM25 algorithm showed the best performance when compared to other parsing and semantic analysis algorithms. For the evaluation, five themes were chosen and for each theme two research queries were elaborated. The queries were submitted to the models and the first 25 sentences with the greatest similarity found were evaluated by a business expert taking into account their relevance. In this experiment, the BM25 had 0.8019 as an average for the nDCG index, a result 20% higher than the second place (LDA250). After the evaluation, the model that uses the BM25 was integrated with the functionality to draft and analyze sentences of the Electronic Judicial Process (PJe) allowing users to easily identify which are the similar sentences in the case in question. The proposed solution is a research alternative during the elaboration of a new sentence, allowing the reuse of some text already developed in a previous similar case, if desired by the magistrate.	pt_BR
dc.description.unidade	Instituto de Ciências Exatas (IE)	pt_BR
dc.description.unidade	Departamento de Ciência da Computação (IE CIC)	pt_BR
dc.description.ppg	Programa de Pós-Graduação em Computação Aplicada, Mestrado Profissional	pt_BR
Aparece nas coleções:	Teses, dissertações e produtos pós-doutorado