Detectando la mentira en lenguaje escrito
Empreu sempre aquest identificador per citar o enllaçar aquest ítem
http://hdl.handle.net/10045/22032
Títol: | Detectando la mentira en lenguaje escrito |
---|---|
Títol alternatiu: | Detecting deception in written language |
Autors: | Almela Sánchez-Lafuente, Ángela | Valencia García, Rafael | Cantos Gómez, Pascual |
Paraules clau: | Lenguaje de la mentira | Minería de opiniones | Extracción de características | Máquinas de soporte vectorial | LIWC | Deception language | Opinion mining | Feature extraction | Support vector machine |
Àrees de coneixement: | Lenguajes y Sistemas Informáticos |
Data de publicació: | de març-2012 |
Editor: | Sociedad Española para el Procesamiento del Lenguaje Natural |
Citació bibliogràfica: | ALMELA SÁNCHEZ-LAFUENTE, Ángela; VALENCIA-GARCÍA, Rafael; CANTOS GÓMEZ, Pascual. “Detectando la mentira en lenguaje escrito”. Procesamiento del Lenguaje Natural. N. 48 (2012). ISSN 1135-5948, pp. 65-72 |
Resum: | La mentira en el lenguaje se ha estudiado desde la perspectiva de varias disciplinas, siendo la más reciente la minería de opiniones. En este contexto, el presente estudio persigue explorar los rasgos sintomáticos de la mentira en lengua escrita en español, lo cual no ha sido aún investigado. Para ello, hemos desarrollado un marco de trabajo basado en un clasificador de máquinas de soporte vectorial (SVM) aplicado a un corpus ad hoc de opiniones. Hemos usado las categorías psicolingüísticas definidas en LIWC (Pennebaker, Francis y Booth, 2001) a través de sus cuatro dimensiones fundamentales para entrenar el algoritmo. Los resultados del experimento muestran que es posible separar los textos en lengua española de acuerdo con su condición de verdad, siendo las dos primeras dimensiones, procesos lingüísticos y psicológicos, las más relevantes para la consecución de tal objetivo. | Deception in language has been studied from the perspective of several disciplines, being the most recent one opinion mining. Within this framework, the present study attempts to explore deception cues in written Spanish, which, to the best of our knowledge, has not been investigated yet. For our purposes, we have developed a framework based on a classifier using a Support Vector Machine (SVM) in order to detect deception in an ad hoc opinion corpus. We have used the psycholinguistic categories defined in LIWC (Pennebaker, Francis and Booth, 2001) through its four broad dimensions for the subsequent training of the abovementioned classifier. The findings reveal that truthful and deceptive texts in Spanish are indeed separable, being the two first dimensions, linguistic and psychological processes, the most relevant ones for fulfilling our aim. |
Patrocinadors: | Este trabajo ha sido financiado por el Ministerio de Ciencia e Innovación a través del proyecto SeCloud (TIN2010-18650). Además de ello, Ángela Almela cuenta con la financiación de la Fundación Séneca (12406/FPI/09). |
URI: | http://hdl.handle.net/10045/22032 |
ISSN: | 1135-5948 |
Idioma: | spa |
Tipus: | info:eu-repo/semantics/article |
Revisió científica: | si |
Apareix a la col·lecció: | Procesamiento del Lenguaje Natural - Nº 48 (2012) |
Arxius per aquest ítem:
Arxiu | Descripció | Tamany | Format | |
---|---|---|---|---|
PLN_48_08.pdf | 666,17 kB | Adobe PDF | Obrir Vista prèvia | |
Tots els documents dipositats a RUA estan protegits per drets d'autors. Alguns drets reservats.