Campo DC | Valor | Idioma |
dc.contributor.advisor | Ladeira, Marcelo | - |
dc.contributor.author | Bispo, Guilherme Dantas | - |
dc.date.accessioned | 2022-05-12T17:54:49Z | - |
dc.date.available | 2022-05-12T17:54:49Z | - |
dc.date.issued | 2022-05-12 | - |
dc.date.submitted | 2021-12-15 | - |
dc.identifier.citation | BISPO, Guilherme Dantas. Inferência de similaridade de sentenças judiciais na Justiça do Trabalho. 2021. xiii, 57 f., il. Dissertação (Mestrado Profissional em Computação Aplicada) — Universidade de Brasília, Brasília, 2021. | pt_BR |
dc.identifier.uri | https://repositorio.unb.br/handle/10482/43690 | - |
dc.description | Dissertação (Mestrado Profissional em Computação Aplicada) — Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, Brasília, 2021. | pt_BR |
dc.description.abstract | Esse trabalho propõe um aperfeiçoamento da funcionalidade de minutar e analisar sentenças do sistema Processo Judicial Eletrônico (PJe) da Justiça do Trabalho permitindo
ao magistrado uma pesquisa mais refinada de sentenças similares demonstrando, inclusive,
o percentual de similaridade das sentenças encontradas com o processo em questão. Para
viabilizar a pesquisa são utilizadas técnicas de mineração de texto para identificar similaridades de sentenças na Justiça do Trabalho. Inicialmente, a performance de modelos
induzidos via técnica sintáticas e modelos induzidos via técnicas semânticas é avaliada.
Para avaliação são considerados três algoritmos: LDA, Doc2Vec e BM25. Os algoritmos são treinados e avaliados com as sentenças do Tribunal Regional do Trabalho da
10ª Região. Baseado nas métricas de P@K e nDCG, o algoritmo BM25 apresentou o
melhor desempenho se comparado aos outros algoritmos de análise sintática e, também,
de análise semântica. Para a avaliação, foram escolhidos cinco temas do Direito do Trabalho e para cada tema foram elaboradas duas queries de pesquisa. As queries foram
submetidas aos modelos e posteriormente as primeiras 25 sentenças de maior similaridade
encontradas foram avaliadas por especialista de negócio levando em consideração a sua
relevância. Nesse experimento o BM25 teve 0.8019 como média para índice nDCG, um
resultado quase 20% superior ao segundo colocado (LDA250). Após a avaliação, o modelo
que usa o BM25 foi integrado a funcionalidade de minutar e analisar sentenças do Processo Judicial Eletrônico (PJe) permitindo aos usuários identificarem de forma fácil quais
são as sentenças similares do caso em questão. A solução proposta é uma alternativa de
pesquisa durante a elaboração de uma nova sentença permitindo o reaproveitamento de
algum texto já desenvolvido em um caso similar anterior, se assim o magistrado desejar. | pt_BR |
dc.language.iso | Português | pt_BR |
dc.rights | Acesso Aberto | pt_BR |
dc.title | Inferência de similaridade de sentenças judiciais na Justiça do Trabalho | pt_BR |
dc.type | Dissertação | pt_BR |
dc.subject.keyword | Recuperação de informação | pt_BR |
dc.subject.keyword | Similaridade de documentos | pt_BR |
dc.subject.keyword | Documentos jurídicos | pt_BR |
dc.rights.license | A concessão da licença deste item refere-se ao termo de autorização impresso assinado pelo autor com as seguintes condições: Na qualidade de titular dos direitos de autor da publicação, autorizo a Universidade de Brasília e o IBICT a disponibilizar por meio dos sites www.bce.unb.br, www.ibict.br, http://hercules.vtls.com/cgi-bin/ndltd/chameleon?lng=pt&skin=ndltd sem ressarcimento dos direitos autorais, de acordo com a Lei nº 9610/98, o texto integral da obra disponibilizada, conforme permissões assinaladas, para fins de leitura, impressão e/ou download, a título de divulgação da produção científica brasileira, a partir desta data. | pt_BR |
dc.description.abstract1 | This work proposes an improvement in the functionality of drafting and analyzing sentences of the Electronic Judicial Process (PJe) system of the Labor Court, allowing the
magistrate a more refined search for similar sentences, even demonstrating the percentage
of similarity of the sentences found with the process in question . To make the research
feasible, text mining techniques are used to identify similarities of sentences in the Labor
Court. Initially, the performance of models induced via syntactic techniques and models
induced via semantic techniques is evaluated. Three algorithms are considered for evaluation: LDA, Doc2Vec and BM25. The algorithms are trained and evaluated with the
judgments of the Regional Labor Court of the 10th Region. Based on P@K and nDCG
metrics, the BM25 algorithm showed the best performance when compared to other parsing and semantic analysis algorithms. For the evaluation, five themes were chosen and
for each theme two research queries were elaborated. The queries were submitted to the
models and the first 25 sentences with the greatest similarity found were evaluated by a
business expert taking into account their relevance. In this experiment, the BM25 had
0.8019 as an average for the nDCG index, a result 20% higher than the second place
(LDA250). After the evaluation, the model that uses the BM25 was integrated with the
functionality to draft and analyze sentences of the Electronic Judicial Process (PJe) allowing users to easily identify which are the similar sentences in the case in question.
The proposed solution is a research alternative during the elaboration of a new sentence,
allowing the reuse of some text already developed in a previous similar case, if desired by
the magistrate. | pt_BR |
dc.description.unidade | Instituto de Ciências Exatas (IE) | pt_BR |
dc.description.unidade | Departamento de Ciência da Computação (IE CIC) | pt_BR |
dc.description.ppg | Programa de Pós-Graduação em Computação Aplicada, Mestrado Profissional | pt_BR |
Aparece nas coleções: | Teses, dissertações e produtos pós-doutorado
|