Comparing languages from vocabulary growth to inflection paradigms: a study run on parallel corpora and multilingual lexicons
Por favor, use este identificador para citar o enlazar este ítem:
http://hdl.handle.net/10045/8074
Registro completo de metadatos
Campo DC | Valor | Idioma |
---|---|---|
dc.contributor.author | Calsamiglia Blancafort, Helena | - |
dc.contributor.author | Loupy, Claude de | - |
dc.date.accessioned | 2008-10-14T15:01:39Z | - |
dc.date.available | 2008-10-14T15:01:39Z | - |
dc.date.issued | 2008-09 | - |
dc.identifier.citation | CALSAMIGLIA BLANCAFORT, Helena; LOUPY, Claude de. “Comparing languages from vocabulary growth to inflection paradigms: a study run on parallel corpora and multilingual lexicons”. Procesamiento del lenguaje natural. N. 41 (sept. 2008). ISSN 1135-5948, pp. 113-120 | en |
dc.identifier.issn | 1135-5948 | - |
dc.identifier.uri | http://hdl.handle.net/10045/8074 | - |
dc.description.abstract | En este artículo presentamos un estudio comparativo de corpus y de léxicos con el objetivo de comparar las dificultades que representan cinco lenguas (inglés, alemán, español, francés e italiano) para el análisis morfosintáctico y el desarrollo de recursos lexicográficos. Para ello hemos llevado a cabo varios experimentos utilizando dos corpus paralelos multilingües y dos léxicos morfosintácticos por lengua. Primero comparamos los resultados cuantitativos respecto a la cobertura dinámica y estática, y las ambigüedades morfosintácticas de los léxicos y corpus. Además, a partir de los léxicos hemos generado paradigmas de flexión para calcular cuántos son necesarios en cada lengua. Los resultados muestran la dificultad de trabajar con recursos multilingües y corpus paralelos. También ofrecen resultados cuantitativos sorprendentes respecto a las diferencias entre lenguas. | en |
dc.description.abstract | In this paper we report on a corpora and lexical comparative study on how to compare the difficulties of five languages (English, German, Spanish, French and Italian) for morphosyntactic analysis and the development of lexicographic resources. Experiments were conducted on two different sets of multilingual parallel corpora and two different morphosyntactic lexicons per language. We measure and compare statistics on dynamic and static coverage, form-lemma and morphosyntactic ambiguities in the lexicon and the corpus. In addition to this, we use the lexicons to automatically generate inflection paradigms and calculate how many inflection paradigms are needed per language. Results show the difficulty of working with multilingual resources and parallel corpora and offer some surprising quantitative results on differences in languages. | en |
dc.language | eng | en |
dc.publisher | Sociedad Española para el Procesamiento del Lenguaje Natural | en |
dc.relation.ispartof | Procesamiento del lenguaje natural. N. 41 (septiembre 2008); pp. 113-120 | en |
dc.subject | Lexicografía computacional | en |
dc.subject | Léxicos morfosintácticos | en |
dc.subject | Morfología computacional | en |
dc.subject | Flexión | en |
dc.subject | Corpus paralelos multilingües | en |
dc.subject | Comparación de lenguas para el PNL | en |
dc.subject | Computational lexicography | en |
dc.subject | Morphosyntactic lexicons | en |
dc.subject | Computational morphology | en |
dc.subject | Inflection | en |
dc.subject | Multilingual parallel corpora | en |
dc.subject | Comparison of languages for NLP | en |
dc.title | Comparing languages from vocabulary growth to inflection paradigms: a study run on parallel corpora and multilingual lexicons | en |
dc.title.alternative | Comparando lenguas desde el léxico a paradigmas de flexión: un estudio sobre corpus paralelo y léxicos multilingües | en |
dc.type | info:eu-repo/semantics/article | en |
dc.rights.accessRights | info:eu-repo/semantics/openAccess | - |
Aparece en las colecciones: | Procesamiento del Lenguaje Natural - Nº 41 (septiembre 2008) |
Archivos en este ítem:
Archivo | Descripción | Tamaño | Formato | |
---|---|---|---|---|
PLN_41_14.pdf | 203,63 kB | Adobe PDF | Abrir Vista previa | |
Todos los documentos en RUA están protegidos por derechos de autor. Algunos derechos reservados.