Desarrollo de un analizador morfológico de catalán antiguo basado en corpus textuales

Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/10045/1567
Información del item - Informació de l'item - Item information
Título: Desarrollo de un analizador morfológico de catalán antiguo basado en corpus textuales
Autor/es: Forcada, Mikel L. | Garrido Alenda, Alicia | Gilabert Zarco, Patricia | Garcia Sempere, Marinela | Montserrat Buendia, Sandra | Iturraspe Bellver, Amaia
Palabras clave: Analizador morfológico | Lengua catalana antigua | Corpus textuales
Fecha de publicación: sep-2003
Editor: Sociedad Española para el Procesamiento del Lenguaje Natural
Cita bibliográfica: FORCADA ZUBIZARRETA, Mikel L., et al. “Desarrollo de un analizador morfológico de catalán antiguo basado en corpus textuales”. Procesamiento del lenguaje natural. Nº 31 (septiembre 2003), pp. 311-312
Resumen: Este proyecto retoma el desarrollo de un analizador morfológico de catalán antiguo públicamente accesible por Internet, el primero de su tipo. Pretendemos que este analizador se convierta en una herramienta útil para el tratamiento morfológico de corpus de catalán antiguo con fines didácticos y de investigación; además, será el primer módulo de un sistema futuro cuyo objetivo es ofrecer automáticamente una lectura en catalán moderno de cualquier texto antiguo en soporte informático. El analizador del que se parte, de cobertura limitada, fue desarrollado por algunos de los autores tomando como base el vocabulario y los paradigmas de flexión antigua recogidos en un diccionario manual (Costa Clos y Tarrés Fernández, 1998). El sistema (extremadamente veloz gracias al uso de técnicas de estados finitos) se genera automáticamente a partir de los datos lingüísticos, cosa que permite una actualización continua y sencilla del programa. Además de reorganizar los diccionarios y completar los paradigmas de flexión y de variación gráfica del lematizador actual, el proyecto se propone usar corpus de textos catalanes antiguos públicamente disponibles (p.ej, RIALC, Biblioteca Virtual Joan Lluís Vives) para hacer el sistema más robusto frente a variaciones gráficas y criterios divergentes de transcripción y para mejorar la cobertura (fracción de texto analizado) mediante la inclusión de entradas según la frecuencia de aparición observada. El objetivo final es la construcción de un analizador morfológico de catalán antiguo que sea rápido, robusto, libremente accesible por Internet y fácilmente integrable en otras aplicaciones (como por ejemplo los buscadores o indexadores de bibliotecas digitales). En este documento se describen brevemente las estrategias lingüísticas e informáticas que se están usando en el proyecto para conseguir estos objetivos.
URI: http://hdl.handle.net/10045/1567
ISSN: 1135-5948
Idioma: spa
Tipo: info:eu-repo/semantics/article
Aparece en las colecciones:Procesamiento del Lenguaje Natural - Nº 31 (septiembre 2003)
INV - TRANSDUCENS - Artículos de Revistas

Archivos en este ítem:
Archivos en este ítem:
Archivo Descripción TamañoFormato 
ThumbnailPLN_31_43.pdf83,31 kBAdobe PDFAbrir Vista previa


Todos los documentos en RUA están protegidos por derechos de autor. Algunos derechos reservados.