Creación, etiquetación y desambiguación de un corpus de referencia del español
Por favor, use este identificador para citar o enlazar este ítem:
http://hdl.handle.net/10045/1769
Título: | Creación, etiquetación y desambiguación de un corpus de referencia del español |
---|---|
Autor/es: | Civit Torruella, Montserrat | Castellón Masalles, Irene | Martí Antonín, Maria Antònia |
Palabras clave: | Anotación morfosintáctica | Desambiguación morfosintáctica | Corpus | Lengua española |
Fecha de publicación: | sep-2001 |
Editor: | Sociedad Española para el Procesamiento del Lenguaje Natural |
Cita bibliográfica: | CIVIT TORRUELLA, Montserrat; CASTELLÓN MASALLES, Irene; MARTÍ ANTONÍN, Maria Antònia. “Creación, etiquetación y desambiguación de un corpus de referencia del español”. Procesamiento del lenguaje natural. Nº 27 (sept. 2001), pp. 21-28 |
Resumen: | En este artículo presentamos los criterios para la anotación y desambiguación morfosintáctica de un corpus de referencia del español que será de libre disposición, proponiendo respuestas concretas a casos problemáticos de ambas tareas. El objetivo final es disponer de una colección escrita de 1 millón de palabras desambiguadas manualmente a nivel tanto morfológico como sintáctico, que pueda utilizarse para el aprendizaje automático así como para la consulta lingüística. Discutimos detalladamente la categorización de las palabras del español así como los criterios lingüísticos de desambigüación. |
Patrocinador/es: | Este trabajo ha sido parcialmente financiado por una beca FPU (AP98-39864555), por la CICYT TIC98-0423-C06 y por X-Tract (PB98-1226). |
URI: | http://hdl.handle.net/10045/1769 |
ISSN: | 1135-5948 |
Idioma: | spa |
Tipo: | info:eu-repo/semantics/article |
Aparece en las colecciones: | Procesamiento del Lenguaje Natural - Nº 27 (septiembre 2001) |
Archivos en este ítem:
Archivo | Descripción | Tamaño | Formato | |
---|---|---|---|---|
PLN_27_02.pdf | 162,74 kB | Adobe PDF | Abrir Vista previa | |
Todos los documentos en RUA están protegidos por derechos de autor. Algunos derechos reservados.