Identificação de precedentes judiciais por agrupamento utilizando processamento de linguagem natural

Stemler, Igor Tadeu Silva Viana

Please use this identifier to cite or link to this item: http://repositorio.unb.br/handle/10482/36866

Files in This Item:

File	Description	Size	Format
2019_IgorTadeuSilvaVianaStemler.pdf		2,18 MB	Adobe PDF	View/Open

Title:	Identificação de precedentes judiciais por agrupamento utilizando processamento de linguagem natural
Authors:	Stemler, Igor Tadeu Silva Viana
Orientador(es)::	Ladeira, Marcelo
Coorientador(es)::	Faleiros, Thiago de Paulo
Assunto::	Insegurança jurídica Abordagem semântica Abordagem sintática Mineração de texto Poder Judiciário - Brasil Precedentes judiciais
Issue Date:	10-Feb-2020
Data de defesa::	5-Jul-2019
Citation:	STEMLER, Igor Tadeu Silva Viana. Identificação de precedentes judiciais por agrupamento utilizando processamento de linguagem natural. 2019. xii, 50 f., il. Dissertação (Mestrado Profissional em Computação Aplicada)—Universidade de Brasília, Brasília, 2019.
Abstract:	Poder Judiciário Brasileiro possui um grande acúmulo de processos e um quantitativo considerável de casos repetitivos. Em 2015 o Código de Processo Civil foi reformulado e criou o Incidente de Resolução de Demandas Repetitivas (IRDR) e Incidente de Assunção de Competência (IAC). Esses institutos permitem aos tribunais de 2ª instância sobrestar o andamento de processos similares em 1ª instância, afetando um deles como processo principal para será julgado como paradigma para os demais. O julgamento nele proferido será aplicado para todos os casos sobrestados em 1ª instância, evitando a insegurança jurídica, já que reduz a chance de processos similares terem soluções judiciais diferentes por terem sido julgados por juízes distintos. Essa insegurança jurídica poderá ocorrer na 2ª instância, uma vez que tribunais diferentes podem julgar causas semelhantes de forma contrária. O objetivo deste trabalho é criar uma ferramenta para identificação automática dos Precedentes Judiciais semelhantes e testar a hipótese de que algoritmos que utilizam abordagens semânticas como o Latent Semantic Indexing (LSI) e Latent Dirichlet Allocation (LDA) apresentam resultados melhores do que aqueles que utilizam somente abordagem sintática como a função de ranqueamento Okapi Best Matching 25 (BM25). Os modelos são avaliados de forma experimental, utilizando métricas de aferição de similaridade e o auxílio de um especialista. O melhor modelo é estendido utilizando entidades nomeadas para verificar se há melhora na performance. Precedentes semelhantes podem ser identificados com a utilização de técnicas baseadas em análise semântica de texto, mas essa abordagem apresenta custo maior do que a abordagem com o modelo BM25. Há melhora nos resultados com o uso de entidades nomeadas, mas com menor precisão ao identificar novos precedentes semelhantes em relação ao modelo BM25, que mostrou ser a melhor opção para a ferramenta em produção. A ferramenta apresenta grafos contendo os precedentes judiciais semelhantes, podendo o usuário verificar se há precedentes semelhantes com decisões divergentes e precedentes que deveriam estar suspensos devido a existência de recursos aos tribunais superiores de questão de mesmo tema.
Abstract:	The Brazilian Judiciary has too many lawsuits and a considerable number of repetitive cases. The Code of Civil Procedure was reformulated in 2015 and created the "incident of resolution of repetitive claims" (IRDR) and "competence assumption incident" (IAC) institutes. These precedents allow the courts of Appeal to suspend similar lawsuits in the first instance, affecting one of them as the main process to be judged as a paradigm for the others. The judgment of this case has to be applied to all cases overturned in the first instance, avoiding legal uncertainty, since it reduces the chance of similar cases being judged differently. This legal uncertainty can occur in the second instance, since different courts can judge similar causes in the different way. The objective of this work is to create a tool for automatic identification of similar precedents and to test the hypothesis that algorithms that use semantic approaches such as Latent Semantic Indexing (LSI) e Latent Dirichlet Allocation (LDA) present better results than those that use only syntactic approach such as the Okapi Best Matching 25 (BM25) ranking function. The models are evaluated experimentally, using similarity gauging metrics and the assistance of a specialist. The best model is extended using named entities to check for performance improvement. Similar precedents can be identified using techniques based on text semantic analysis, but this approach is more costly than the BM25 approach. There is improvement in the results with the use of named entities, but with less precision when identifying similar new precedents in relation to the BM25 model, which appears to be the best option for the tool in production. The tool presents graphs containing similar precedents, and the user can verify if there are similar precedents with divergent decisions and precedents that should be suspended due to the existence of appeals to the higher courts of issue of the same subject.
metadata.dc.description.unidade:	Instituto de Ciências Exatas (IE) Departamento de Ciência da Computação (IE CIC)
Description:	Dissertação (mestrado)—Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, 2019.
metadata.dc.description.ppg:	Programa de Pós-Graduação em Computação Aplicada, Mestrado Profissional
Licença::	A concessão da licença deste item refere-se ao termo de autorização impresso assinado pelo autor com as seguintes condições: Na qualidade de titular dos direitos de autor da publicação, autorizo a Universidade de Brasília e o IBICT a disponibilizar por meio dos sites www.bce.unb.br, www.ibict.br, http://hercules.vtls.com/cgi-bin/ndltd/chameleon?lng=pt&skin=ndltd sem ressarcimento dos direitos autorais, de acordo com a Lei nº 9610/98, o texto integral da obra disponibilizada, conforme permissões assinaladas, para fins de leitura, impressão e/ou download, a título de divulgação da produção científica brasileira, a partir desta data.
Agência financiadora:	Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES).
Appears in Collections:	Teses, dissertações e produtos pós-doutorado

Show full item record " class="statisticsLink btn btn-primary" href="/jspui/handle/10482/36866/statistics">