Detección automática de chilenismos verbales a partir de reglas morfosintácticas. Resultados preliminares

Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/10045/45507
Información del item - Informació de l'item - Item information
Título: Detección automática de chilenismos verbales a partir de reglas morfosintácticas. Resultados preliminares
Título alternativo: Automatic detection of verbal chilenismos using morphosyntactic rules. First results
Autor/es: Koza, Walter A. | Alfaro Faccio, Pedro | Martínez Gamboa, Ricardo
Palabras clave: Chilenismo verbal | Detección automática | Reglas morfosintácticas | Smorph | MPS | Verbal chilenismo | Automatic detection | Morphosyntactic rules
Área/s de conocimiento: Lenguajes y Sistemas Informáticos
Fecha de publicación: mar-2015
Editor: Sociedad Española para el Procesamiento del Lenguaje Natural
Cita bibliográfica: Procesamiento del Lenguaje Natural. 2015, 54: 69-76
Resumen: En el presente artículo, se describen las tareas realizadas para el desarrollo de un extractor automático de verbos diferenciales del español chileno mediante la aplicación de reglas de lenguaje natural. A partir de este objetivo, se procedió a la modelización de características léxicas, morfológicas y sintácticas de estas expresiones, la cual permitió la posterior implantación en máquina. En primer lugar, se clasificaron los chilenismos verbales en cuatro tipos, según su uso registrado en los diccionarios y su naturaleza sintáctica: puros, puros pronominales, de sentido y de sentido pronominales. En segundo lugar, se establecieron reglas sintácticas para el reconocimiento automático. En el trabajo computacional se utilizaron las herramientas Smorph y Módulo Post Smorph, que trabajan en bloque a base de reglas del lenguaje natural. Este método se probó en un corpus compuesto por 5.194 tweets, producidos por usuarios chilenos, logrando 85,54% de precisión, 96.16% de cobertura y 90,53% de medida f. Los resultados permiten validar el método propuesto, aunque se detectaron algunas limitaciones y detecciones erróneas, lo que implicaría la necesidad de especificación de algunas reglas y la creación de nuevas, tanto para la detección automática como para el filtrado de etiquetados erróneos. | In this paper, the tasks made for obtaining an automatic extractor for verbal chilenismos using natural language rules are described. With this objective, a formalization of lexical, morphological and syntactic features was made, for a subsequent computational implementation. Firstly, verbal chilenismos were classified in four kinds, according to the use registered in the dictionaries and syntactic features: pure, pure-clitic, of sense, and of sense- clitic. Secondly, syntactic rules were established for the automatic recognition. Smorph and Post Smorph Module were used in the computational work, both use natural language rules. The method was tested in a corpus composed by 5194 tweets produced in Chile, obtaining 85.54% of precision, 96.16% of coverage, and 90.53% of F-measure. The results show that this method is able for this kind of work, all the same, some limitations and mistakes were detected and more specific and new rules are necessary for the recognition task and for filtering wrong tagged.
URI: http://hdl.handle.net/10045/45507
ISSN: 1135-5948
Idioma: spa
Tipo: info:eu-repo/semantics/article
Derechos: © Sociedad Española para el Procesamiento del Lenguaje Natural
Revisión científica: si
Versión del editor: http://journal.sepln.org/sepln/ojs/ojs/index.php/pln
Aparece en las colecciones:Procesamiento del Lenguaje Natural - Nº 54 (2015)

Archivos en este ítem:
Archivos en este ítem:
Archivo Descripción TamañoFormato 
ThumbnailPLN_54_08.pdf687,57 kBAdobe PDFAbrir Vista previa


Todos los documentos en RUA están protegidos por derechos de autor. Algunos derechos reservados.