Please use this identifier to cite or link to this item:
http://hdl.handle.net/10174/16317
|
Title: | Marcação das partes do discurso usando computação evolucionária |
Authors: | Silva, Ana Paula Neves Ferreira da |
Advisors: | Rodrigues, Irene Pimenta |
Issue Date: | 2013 |
Publisher: | Universidade de Évora |
Abstract: | A marcação das partes do discurso constitui uma tarefa de considerável importância
na área de processamento de língua natural. O seu objectivo consiste em marcar
automaticamente as palavras de um texto com etiquetas que designam as partes do
discurso adequadas.
A abordagem proposta nesta tese divide o problema em duas tarefas: uma de aprendizagem
e outra de optimização. Foram adoptados algoritmos da área da computação
evolucionária em cada uma das fases. Destacamos a utilização de inteligência de enxame,
não só pelos bons resultados alcançados, mas também por se revelar uma das
primeiras aplicações deste tipo de algoritmos a este problema.
A abordagem foi pensada com o objectivo de poder ser alargada a outras tarefas de
processamento de língua natural, com características comuns à da marcação das partes
do discurso. Os resultados obtidos em corpora em língua Inglesa e Portuguesa
encontram-se entre os melhores publicados; ABSTRACT: Part-of-speech tagging is a task of considerable importance in the field of natural
language processing. Its purpose is to automatically tag the words of a text with
labels that designate the appropriate parts-of-speech.
The approach proposed in this thesis divides the problem into two tasks: a learning
task and an optimization task. Algorithms from the field of evolutionary computing
were adopted to tackle each of those tasks. We emphasize the use of swarm intelligence,
not only for the good results achieved, but also because it is one of the first applications
of such algorithms to this problem.
This approach was designed with the aim of being easily extended to other natural
language processing tasks that share characteristics with the part-of-speech tagging
problem. The results obtained in English and Portuguese language corpora are among
the best published. |
URI: | http://hdl.handle.net/10174/16317 |
Type: | doctoralThesis |
Appears in Collections: | BIB - Formação Avançada - Teses de Doutoramento
|
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.
|