Please use this identifier to cite or link to this item:
http://hdl.handle.net/10174/24848
|
Title: | Automatic extraction and structure of arguments in legal documents |
Authors: | Poudyal, Prakash |
Advisors: | Quaresma, Paulo Gonçalves, Teresa |
Keywords: | Mineração de argumento Domínio legal Aprendizado de máquina SVM Fuzzy clustering Argument mining Legal domain Machine learning SVM Fuzzy clustering |
Issue Date: | 4-Dec-2018 |
Publisher: | Universidade de Évora |
Abstract: | A argumentação desempenha um papel fundamental na comunicação humana ao formular razões
e tirar conclusões. Desenvolveu-se um sistema automático para identificar argumentos jurídicos de
forma eficaz em termos de custos a partir da jurisprudência. Usando 42 leis jurídicas do Tribunal
Europeu dos Direitos Humanos (ECHR), anotou-se os documentos para estabelecer um conjunto de
dados “padrão-ouro”.
Foi então desenvolvido e testado um processo composto por 3 etapas para mineração de argumentos.
A primeira etapa foi avaliar o melhor conjunto de recursos para identificar automaticamente as
frases argumentativas do texto não estruturado. Várias experiencias foram conduzidas dependendo
do tipo de características disponíveis no corpus, a fim de determinar qual abordagem que produzia
os melhores resultados. No segundo estágio, introduziu-se uma nova abordagem de agrupamento
automático (para agrupar frases num argumento legal coerente), através da utilização de dois novos
algoritmos: o “Algoritmo de Identificação do Grupo Apropriado”, ACIA e a “Distribuição de orações
no agrupamento de Cluster”, DSCA. O trabalho inclui também um sistema de avaliação do algoritmo
de agrupamento que permite ajustar o seu desempenho. Na terceira etapa do trabalho, utilizou-se
uma abordagem híbrida de técnicas estatísticas e baseadas em regras para categorizar as orações
argumentativas.
No geral, observa-se que o nível de precisão e utilidade alcançado por essas novas técnicas é viável
como base para uma estrutura geral de argumentação e mineração; Abstract:
Automatic Extraction and Structure of
Arguments in Legal Documents
Argumentation plays a cardinal role in human communication when formulating reasons and drawing
conclusions. A system to automatically identify legal arguments cost-effectively from case-law
was developed. Using 42 legal case-laws from the European Court of Human Rights (ECHR), an
annotation was performed to establish a ‘gold-standard’ dataset. Then a three-stage process for
argument mining was developed and tested.
The first stage aims at evaluating the best set of features for automatically identifying argumentative
sentences within unstructured text. Several experiments were conducted, depending upon the type
of features available in the corpus, in order to determine which approach yielded the best result.
In the second stage, a novel approach to clustering (for grouping sentences automatically into a
coherent legal argument) was introduced through the development of two new algorithms: the
“Appropriate Cluster Identification Algorithm”,(ACIA) and the “Distribution of Sentence to the
Cluster Algorithm” (DSCA). This work also includes a new evaluation system for the clustering
algorithm, which helps tuning it for performance. In the third stage, a hybrid approach of statistical
and rule-based techniques was used in order to categorize argumentative sentences.
Overall, it’s possible to observe that the level of accuracy and usefulness achieve by these new
techniques makes it viable as the basis of a general argument-mining framework. |
URI: | http://hdl.handle.net/10174/24848 |
Type: | doctoralThesis |
Appears in Collections: | BIB - Formação Avançada - Teses de Doutoramento
|
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.
|