Análisis de similitud basado en grafos: una nueva aproximación a la detección de plagio translingüe

Franco-Salvador, Marc; Gupta, Parth; Rosso, Paolo

Análisis de similitud basado en grafos: una nueva aproximación a la detección de plagio translingüe

Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/10045/27860

Información del item - Informació de l'item - Item information
Título:	Análisis de similitud basado en grafos: una nueva aproximación a la detección de plagio translingüe
Título alternativo:	Graph-based similarity analysis: a new approach to cross-language plagiarism detection
Autor/es:	Franco-Salvador, Marc \| Gupta, Parth \| Rosso, Paolo
Palabras clave:	Detección de plagio translingüe \| Similitud textual \| Red semántica multilingüe \| BabelNet \| Grafos de conocimiento \| Cross-language plagiarism detection \| Textual similarity \| Multilingual semantic network \| Knowledge graphs
Área/s de conocimiento:	Lenguajes y Sistemas Informáticos
Fecha de publicación:	mar-2013
Editor:	Sociedad Española para el Procesamiento del Lenguaje Natural
Cita bibliográfica:	FRANCO-SALVADOR, Marc; GUPTA, Parth; ROSSO, Paolo. “Análisis de similitud basado en grafos: una nueva aproximación a la detección de plagio translingüe”. Procesamiento del Lenguaje Natural. N. 50 (2013). ISSN 1135-5948, pp. 21-28
Resumen:	La variante translingüe de la detección de plagio automática trata de detectar plagio entre documentos en diferentes idiomas. En los últimos años se han propuesto una serie de aproximaciones que hacen uso de tesauros, modelos de alineamiento o diccionarios estadísticos para lidiar con la similitud a través de idiomas. En este trabajo proponemos una nueva aproximación a la detección de plagio translingüe que hace uso de una red semántica multilingüe para generar grafos de conocimiento, obteniendo un modelo de contexto para cada documento, de lo cual carecen otros métodos. Para evaluar nuestra propuesta, utilizamos las particiones español-inglés y alemán-inglés del corpus PAN-PC’11, comparando nuestros resultados con dos de las aproximaciones del estado del arte. Los resultados experimentales indican su potencial como alternativa para el análisis de similitud en detección de plagio translingüe. \| Cross-language variant of automatic plagiarism detection tries to detect plagiarism among documents across language pairs. In recent years a few approaches are proposed that use thesauri, alignment models or statistical dictionaries to deal with the similarity across languages. We propose a new approach to the cross-language plagiarism detection that makes use of a multilingual semantic network to generate knowledge graphs, obtaining a context model for each document which the other methods lack. To evaluate the proposed method, we use the Spanish-English and German-English partitions of the PAN-PC’11 corpus and compare our results with two state-of-the-art approaches. Experimental results indicate its potential to be a new alternative for similarity analysis in cross-language plagiarism detection.
Patrocinador/es:	Conselleria d′Educació, Formació i Ocupació de la Generalitat Valenciana (financiación por parte del programa Gerónimo Forteza). Este trabajo se ha hecho dentro del ámbito del VLC/CAMPUS Microcluster on Multimodal Interaction in Intelligent Systems y como parte del proyecto de la Comisión Europea WIQ-EI IRSES (no. 269180).
URI:	http://hdl.handle.net/10045/27860
ISSN:	1135-5948
Idioma:	spa
Tipo:	info:eu-repo/semantics/article
Revisión científica:	si
Aparece en las colecciones:	Procesamiento del Lenguaje Natural - Nº 50 (2013)

Archivos en este ítem:

Archivos en este ítem:
Archivo	Descripción	Tamaño	Formato
PLN_50_02.pdf		761,5 kB	Adobe PDF	Abrir Vista previa Cerrar vista previa

Ver citas en Google Académico

Muestra el registro completo