Alineamiento de entidades con nombre usando distancia léxica

Please use this identifier to cite or link to this item: http://hdl.handle.net/10045/3120
Full metadata record
Full metadata record
DC FieldValueLanguage
dc.contributor.authorBorrego Ropero, Rafael-
dc.contributor.authorDíaz Madrigal, Víctor Jesús-
dc.date.accessioned2007-11-20T13:09:17Z-
dc.date.available2007-11-20T13:09:17Z-
dc.date.issued2007-04-
dc.identifier.citationBORREGO ROPERO, Rafael; DÍAZ MADRIGAL, Victor Jesús. "Alineamiento de entidades con nombre usando distancia léxica". Procesamiento del lenguaje natural. N. 38 (abr. 2007). ISSN 1135-5948, pp. 61-66en
dc.identifier.issn1135-5948-
dc.identifier.urihttp://hdl.handle.net/10045/3120-
dc.description.abstractEn este artículo se presenta un sistema para asistir en el etiquetado de entidades con nombre y palabras semánticamente relevantes en corpora bilingüe. Además de las heurísticas usadas habitualmente para el alineamiento de corpora basadas en la frecuencia y la posición, se ha aprovechado el alto parecido lexicográfico entre palabras pertenecientes a lenguajes cercanos, como el español y el francés, para usar el algoritmo Edit Distance. Tras estudiar los resultados de estas técnicas, se ha realizado un sistema de votación ponderada que, a partir de una secuencia de palabras en un lenguaje, propone una secuencia equivalente en el otro idioma. Al ser técnicas que no se basan en un conocimiento previo de los lenguajes, pueden ser adaptadas para etiquetar dos lenguajes cualesquiera que tengan un tronco común.en
dc.description.abstractIn this article a system is presented to help in labelling named entities and meaningful words in bilingual parallel corpora. Besides the strategies used frequently in the alignment of corpora based on word frequency and position, it has been taken advantage of the high lexicographical similarity among words in nearby languages as Spanish and French to use the algorithm Edit Distance. After studying the results of these techniques, a system of voting has been defined that given a set of words in a language, an equivalent set in another language is proposed. As these techniques are not based on a previous knowledge of the languages, they can be used to label any pair of languages that share a common branch.en
dc.description.sponsorshipEste trabajo ha sido parcialmente financiado por el Ministerio de Educación y Ciencia (TIN 2004-07246-C03-03).en
dc.languagespaen
dc.publisherSociedad Española para el Procesamiento del Lenguaje Naturalen
dc.relation.ispartofProcesamiento del Lenguaje Natural. N. 38 (abril 2007); pp. 61-66en
dc.subjectAlineamientoen
dc.subjectEtiquetado de entidadesen
dc.subjectEdit distanceen
dc.subjectCorpora bilingüeen
dc.subjectAlignmenten
dc.subjectName entity recognitionen
dc.subjectBilingual corporaen
dc.titleAlineamiento de entidades con nombre usando distancia léxicaen
dc.typeinfo:eu-repo/semantics/articleen
dc.rights.accessRightsinfo:eu-repo/semantics/openAccess-
Appears in Collections:Procesamiento del Lenguaje Natural - Nº 38 (abril 2007)

Files in This Item:
Files in This Item:
File Description SizeFormat 
ThumbnailPLN_38_08.pdf65,15 kBAdobe PDFOpen Preview


Items in RUA are protected by copyright, with all rights reserved, unless otherwise indicated.