Segmentador de oraciones basado en máquinas de estados finitos
Por favor, use este identificador para citar o enlazar este ítem:
http://hdl.handle.net/10045/136580
Título: | Segmentador de oraciones basado en máquinas de estados finitos |
---|---|
Autor/es: | Martínez Molina, Iván |
Director de la investigación: | Pla Sempere, Leopoldo |
Centro, Departamento o Servicio: | Universidad de Alicante. Departamento de Lenguajes y Sistemas Informáticos |
Palabras clave: | Segmentador de Oraciones | C | FST | SRX |
Fecha de publicación: | 28-jul-2023 |
Fecha de lectura: | 25-jul-2023 |
Resumen: | La segmentación de un texto en oraciones en tareas de procesamiento del lenguaje natural (PLN en adelante) es un procedimiento estándar antes de procesar información en texto llano (preprocesamiento). Algunas aplicaciones de PLN requieren segmentar textos muy largos en oraciones para obtener información más significativa. Un segmentador de oraciones básico es aquel que separa por puntos, pero no cubre todos los casos (abreviaturas) ni idiomas donde este carácter no se utiliza. Existen varias implementaciones en diferentes lenguajes de programación y con diferentes paradigmas o enfoques. Aun así, estas implementaciones no son extremadamente rápidas ni fácilmente extensibles a nuevos idiomas no soportados por los desarrolladores de estas implementaciones. Esto se acentúa con cantidades masivas de datos, como sucede con textos como los de Paracrawl. Se plantea utilizar una técnica muy rápida basada en estados finitos, tal y como está implementado el sistema de traducción Apertium, partiendo de las anotaciones existentes en el estándar SRX (Segmentation Rule Exchange). |
URI: | http://hdl.handle.net/10045/136580 |
Idioma: | spa |
Tipo: | info:eu-repo/semantics/bachelorThesis |
Derechos: | Licencia Creative Commons Reconocimiento-NoComercial-SinObraDerivada 4.0 |
Aparece en las colecciones: | Grado en Ingeniería Informática - Trabajos Fin de Grado |
Archivos en este ítem:
Archivo | Descripción | Tamaño | Formato | |
---|---|---|---|---|
Segmentador_de_oraciones_basado_en_maquinas_de_estados__MARTINEZ_MOLINA_IVAN.pdf | 1,53 MB | Adobe PDF | Abrir Vista previa | |
Todos los documentos en RUA están protegidos por derechos de autor. Algunos derechos reservados.