Segmentador de oraciones basado en máquinas de estados finitos

Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/10045/136580
Información del item - Informació de l'item - Item information
Título: Segmentador de oraciones basado en máquinas de estados finitos
Autor/es: Martínez Molina, Iván
Director de la investigación: Pla Sempere, Leopoldo
Centro, Departamento o Servicio: Universidad de Alicante. Departamento de Lenguajes y Sistemas Informáticos
Palabras clave: Segmentador de Oraciones | C | FST | SRX
Fecha de publicación: 28-jul-2023
Fecha de lectura: 25-jul-2023
Resumen: La segmentación de un texto en oraciones en tareas de procesamiento del lenguaje natural (PLN en adelante) es un procedimiento estándar antes de procesar información en texto llano (preprocesamiento). Algunas aplicaciones de PLN requieren segmentar textos muy largos en oraciones para obtener información más significativa. Un segmentador de oraciones básico es aquel que separa por puntos, pero no cubre todos los casos (abreviaturas) ni idiomas donde este carácter no se utiliza. Existen varias implementaciones en diferentes lenguajes de programación y con diferentes paradigmas o enfoques. Aun así, estas implementaciones no son extremadamente rápidas ni fácilmente extensibles a nuevos idiomas no soportados por los desarrolladores de estas implementaciones. Esto se acentúa con cantidades masivas de datos, como sucede con textos como los de Paracrawl. Se plantea utilizar una técnica muy rápida basada en estados finitos, tal y como está implementado el sistema de traducción Apertium, partiendo de las anotaciones existentes en el estándar SRX (Segmentation Rule Exchange).
URI: http://hdl.handle.net/10045/136580
Idioma: spa
Tipo: info:eu-repo/semantics/bachelorThesis
Derechos: Licencia Creative Commons Reconocimiento-NoComercial-SinObraDerivada 4.0
Aparece en las colecciones:Grado en Ingeniería Informática - Trabajos Fin de Grado

Archivos en este ítem:
Archivos en este ítem:
Archivo Descripción TamañoFormato 
ThumbnailSegmentador_de_oraciones_basado_en_maquinas_de_estados__MARTINEZ_MOLINA_IVAN.pdf1,53 MBAdobe PDFAbrir Vista previa


Todos los documentos en RUA están protegidos por derechos de autor. Algunos derechos reservados.