A named entity recognition system based on a finite automata acquisition algorithm

Empreu sempre aquest identificador per citar o enllaçar aquest ítem http://hdl.handle.net/10045/1330
Información del item - Informació de l'item - Item information
Títol: A named entity recognition system based on a finite automata acquisition algorithm
Autors: Padró Cirera, Montserrat | Padró Cirera, Lluís
Paraules clau: Reconocimiento de nombres propios | Autómatas de estados finitos | Aprendizaje automático | Named entity recognition | Finite state automaton | Machine learning
Data de publicació: de setembre-2005
Editor: Sociedad Española para el Procesamiento del Lenguaje Natural
Citació bibliogràfica: PADRÓ CIRERA, Montserrat; PADRÓ CIRERA, Lluís. “A named entity recognition system based on a finite automata acquisition algorithm”. Procesamiento del lenguaje natural. Nº 35 (sept. 2005), pp. 319-326
Resum: En este artículo presentamos un nuevo sistema para el reconocimiento de nombres propios en español. Este sistema está basado en el algoritmo CSSR (Causal-States Splitting Reconstruction) (Shalizi and Shalizi, 2004) que aprende un autómata de estados finitos partiendo de datos secuenciales. Los resultados obtenidos son ligeramente peores que los mejores sistemas presentados en la “shared task” del CoNLL 2002, pero dada la simplicidad de los atributos utilizados, estos resultados son realmente prometedores y creemos que pueden ser fácilmente mejorados introduciendo más información al sistema. | In this work, a new Named Entity Recognition system for Spanish is presented. This system is based on Causal-State Splitting Reconstruction algorithm (Shalizi and Shalizi, 2004), which learns a finite automaton from data sequences. The obtained results are slightly below the best systems presented in CoNLL 2002 shared task, though given the simplicity of the used features, they are really promising. Furthermore, we think that these results can be easily improved by introducing more information in the system.
Patrocinadors: This research is being funded by the Catalan Government Research Department (DURSI), by the Spanish Ministry of Science and Technology (ALIADO TIC2002-04447-C02) and by the European Comission projects: Meaning (IST-2001-34460) and CHIL (IST-2004-506909).
URI: http://hdl.handle.net/10045/1330
ISSN: 1135-5948
Idioma: eng
Tipus: info:eu-repo/semantics/article
Apareix a la col·lecció: Procesamiento del Lenguaje Natural - Nº 35 (septiembre 2005)

Arxius per aquest ítem:
Arxius per aquest ítem:
Arxiu Descripció Tamany Format  
ThumbnailPLN_35_39.pdf101,01 kBAdobe PDFObrir Vista prèvia


Tots els documents dipositats a RUA estan protegits per drets d'autors. Alguns drets reservats.