Please use this identifier to cite or link to this item:
http://hdl.handle.net/10174/16901
|
Title: | Classificador para língua natural |
Authors: | Laboreiro, Gustavo Alexandre Teixeira |
Advisors: | Rodrigues, Irene Pimenta |
Issue Date: | Oct-2007 |
Publisher: | Universidade de Évora |
Abstract: | Esta dissertação apresenta um classificador para textos não anotados escritos na língua inglesa, que não necessita de treino, Para estabelecer a relação entre palavras recorre-se à base de dados da WordNet. Cada palavra do texto é comparada com cada conceito que define os temas de catalogação. Esta comparação é efetuada tendo em consideração a estrutura hierárquica das relações definidas na WordNet. Desta forma é conservada a afinidade entre termos mais gerais ou específicos, bem como entre termos da mesma área. O programa foi desenvolvido com o fim de integrar um sistema concorrente no TRECVID - um concurso anual que visa encorajar 0 avanço do desenvolvimento de aplicações na área de busca e indexação de vídeo digital. Apesar do âmbito inicial ser específico, a aplicação revela grande potencial para ser usado em qualquer texto em inglês. /ABSTRACT - This work presents a training-free, English language, unannotated text classifier. WordNet's database is used as a foundation to relate words. Each word is compared to a concept that defines the classification topics. This operation takes the hierarchical nature of WordNet's relations into account. In this way, the affinity between more general and more specific terms is maintained, as well as terms in the same domain. The program was developed to integrate a competing system at TREC-VID - an annual competition that aims to encourage research in video indexation and retrieval, Despite the restricted initial goal, the application shows great potential to be used with any English text. |
URI: | http://hdl.handle.net/10174/16901 |
Type: | masterThesis |
Appears in Collections: | BIB - Formação Avançada - Teses de Mestrado
|
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.
|