Técnicas de clasificación de opiniones aplicadas a un corpus en español

Martínez Cámara, Eugenio; Martín Valdivia, María Teresa; Perea Ortega, José Manuel; Ureña López, Luis Alfonso

Técnicas de clasificación de opiniones aplicadas a un corpus en español

Please use this identifier to cite or link to this item: http://hdl.handle.net/10045/18524

Información del item - Informació de l'item - Item information
Title:	Técnicas de clasificación de opiniones aplicadas a un corpus en español
Other Titles:	Opinion classification techniques applied to a Spanish corpus
Authors:	Martínez Cámara, Eugenio \| Martín Valdivia, María Teresa \| Perea Ortega, José Manuel \| Ureña López, Luis Alfonso
Keywords:	Minería de opiniones \| Clasificación de la polaridad \| Corpus de opiniones en español \| Análisis de sentimientos \| Opinion mining \| Sentiment polarity classification \| Opinion corpus in Spanish \| Sentimental analysis
Knowledge Area:	Lenguajes y Sistemas Informáticos
Issue Date:	Sep-2011
Publisher:	Sociedad Española para el Procesamiento del Lenguaje Natural
Citation:	MARTÍNEZ CÁMARA, Eugenio, et al. “Técnicas de clasificación de opiniones aplicadas a un corpus en español”. Procesamiento del Lenguaje Natural. N. 47 (2011). ISSN 1135-5948, pp. 163-170
Abstract:	El análisis de sentimientos es una nueva tarea que combina técnicas de minería de texto y Procesamiento del Lenguaje Natural (PLN). Aunque existen ya varios trabajos relacionados con la temática, la mayoría de ellos únicamente usan textos en inglés. Sin embargo, el número de páginas webs, blogs u opiniones vertidas en Internet que usan cualquier idioma, no sólo el inglés, crece exponencialmente. De hecho, otros idiomas como el español incrementan su presencia en la red día a día. Es por ello que en este trabajo se presenta un estudio experimental sobre un corpus de opiniones sobre películas escrito en español. Nuestro objetivo principal consiste en comprobar cómo se comportan varios clasificadores entrenados para determinar la polaridad de las opiniones en dicho corpus. Para ello hemos usado dos clasificadores (SVM y Naïve Bayes) variando además distintos parámetros como el esquema de pesado o la utilización o no de stopper y stemmer. Los experimentos realizados muestran que SVM se comporta mejor que Naïve Bayes y que el uso de stopper y stemmer también mejora los resultados. \| Sentiment analysis is a new challenging task related to Text Mining and Natural Language Processing (NLP). Although there are some current works, most of them only focus on English texts. However, web pages, blogs and opinions on the Internet are increasing every day in any language and not only in English. Other language like Spanish is increasingly present so we have carried out an experimental study with a Spanish films reviews corpus. Our main goal is to check the results obtained using several classifiers trained in order to determinate the opinion polarity. We have tested two classification algorithms (SVM, Naïve Bayes) and several weighting schemes and different linguistic preprocessing (stopper and stemmer). The accomplished experiments show that SVM works better than Naïve Bayes. In addition, the stopper and stemmer also obtain a slight improvement.
Sponsor:	Esta investigación ha sido parcialmente financiada por el Fondo Europeo de Desarrollo Regional (FEDER), proyecto TEXT-COOL 2.0 (TIN2009-13391-C04-02) del Gobierno Español, por la Junta de Andalucía, proyecto GeOasis (P08-TIC-41999), y por el Instituto de Estudios Giennenses, proyecto RFC/IEG2010.
URI:	http://hdl.handle.net/10045/18524
ISSN:	1135-5948
Language:	spa
Type:	info:eu-repo/semantics/article
Peer Review:	si
Appears in Collections:	Procesamiento del Lenguaje Natural - Nº 47 (2011)

Files in This Item:

Files in This Item:
File	Description	Size	Format
PLN_47_17.pdf		538,71 kB	Adobe PDF	Open Preview Close preview

See citations in Google Scholar

Show full item record