Análisis de la riqueza léxica en el contexto de la clasificación de atributos demográficos latentes

Roberto, John A.; Martí Antonín, Maria Antònia; Salamó Llorente, Maria

Análisis de la riqueza léxica en el contexto de la clasificación de atributos demográficos latentes

Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/10045/22057

Información del item - Informació de l'item - Item information
Título:	Análisis de la riqueza léxica en el contexto de la clasificación de atributos demográficos latentes
Título alternativo:	Analysis of lexical richness in the context of latent demographic user attributes classification
Autor/es:	Roberto, John A. \| Martí Antonín, Maria Antònia \| Salamó Llorente, Maria
Palabras clave:	Sistemas de recomendación \| Categorización de textos \| Riqueza léxica \| Recommender systems \| Text categorization \| Lexical richness
Área/s de conocimiento:	Lenguajes y Sistemas Informáticos
Fecha de publicación:	mar-2012
Editor:	Sociedad Española para el Procesamiento del Lenguaje Natural
Cita bibliográfica:	ROBERTO, John A.; MARTÍ, M. Antònia; SALAMÓ, Maria. “Análisis de la riqueza léxica en el contexto de la clasificación de atributos demográficos latentes”. Procesamiento del Lenguaje Natural. N. 48 (2012). ISSN 1135-5948, pp. 97-104
Resumen:	En este artículo analizamos la utilidad que tiene el cálculo de la riqueza léxica para predecir atributos demográficos latentes en textos de opinión del español. Nuestro objetivo es determinar hasta qué punto la riqueza léxica permite predecir el sexo, la edad y la procedencia de los autores de este tipo de textos. Para ello hemos analizado 32 métricas de la riqueza léxica en 1911 textos de opinión previamente etiquetados con información demográfica. Esta aproximación tiene como principales ventajas la independencia del dominio y la reducción del coste computacional. \| In this paper we analyse the utility of Lexical richness estimations to predict latent user attributes shown in Spanish opinionated texts. Our aim is to establish how useful could be the Lexical richness to predict user’s gender, age and regional origin. Because of this goal, we applied 32 lexical richness measures to 1911 previously labeled texts with demographic information. This approach has the advantage that it is domain-independent with modest computational cost.
URI:	http://hdl.handle.net/10045/22057
ISSN:	1135-5948
Idioma:	spa
Tipo:	info:eu-repo/semantics/article
Revisión científica:	si
Aparece en las colecciones:	Procesamiento del Lenguaje Natural - Nº 48 (2012)

Archivos en este ítem:

Archivos en este ítem:
Archivo	Descripción	Tamaño	Formato
PLN_48_12.pdf		791,57 kB	Adobe PDF	Abrir Vista previa Cerrar vista previa

Ver citas en Google Académico

Muestra el registro completo