Please use this identifier to cite or link to this item:
http://hdl.handle.net/10174/19422
|
Title: | OntoSPARES: da linguagem natural às ontologias. Contributos para a classificação automática de dados históricos (séc. XVI-XVIII) |
Authors: | Ferreira, Albertina Maria Gomes |
Advisors: | Caldeira, Carlos Pampulim Olival, Fernanda |
Keywords: | Ontologias Linguagem natural Bases de dados históricas Prosopografia Ontologies Natural language Historical databases Proposography |
Issue Date: | 16-Nov-2016 |
Publisher: | Universidade de Évora |
Abstract: | O processamento de linguagem natural e as ontologias são ferramentas cuja interação permite uma melhor
compreensão dos dados armazenados. Este trabalho, ao associar estas duas áreas aos elementos disponíveis
numa base de dados prosopográfica, tornou possível identificar e classificar relacionamentos entre setores de
ocupação na forma como eram designados na época, setores de atividade num formato mais próximo do de
hoje e o estatuto social que essas incumbências tinham na sociedade coeva. Os dados utilizados são sobretudo
de membros do Santo Ofício – do século XVI ao século XVIII. Para atingir este objetivo utilizaram-se algumas
descrições textuais de ocorrências da época e outras pouco estruturadas, disponíveis no repositório SPARES.
A aplicação de processamento de linguagem natural (remoção de stopwords e aplicação de stemming), conjugada
com a construção de duas ontologias, tornou possível classificar esses dados, permitindo consultas mais
eficazes. Ao contribuir para a classificação automática de dados históricos, propõem-se metodologias que podem
ser aplicadas em dados de qualquer outra área do conhecimento, especialmente as que lidam com as
variáveis de tempo e espaço de forma mais intensa; Abstract:
OntoSPARES: from natural language to ontologies
Contributions to the automatic classification of historical data (16th-18th centuries)
The interaction between the natural language processing and ontologies are tools allowing a better understanding
of the data stored. This work, by combining these two areas to the elements available in a prosopographic
database, has made possible to identify and classify relationships between occupations of many individuals
(in general Holy Office members of the 16th-18th centuries). To achieve this goal the data used was gathered
in SPARES repository, including some textual descriptions of the time occurrences. They are all few structured.
The application of natural language processing (stopwords removal and stemming application), combined with
the construction of two ontologies, made possible to classify those data, allowing a more effective search. By
contributing to the automatic classification of historical data, this thesis proposes methodologies that can be
applied to data from any other field of knowledge, specially data dealing with time and space variables. |
URI: | http://hdl.handle.net/10174/19422 |
Type: | doctoralThesis |
Appears in Collections: | BIB - Formação Avançada - Teses de Doutoramento
|
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.
|