Un análisis comparativo de estrategias para la categorización semántica de textos cortos

Please use this identifier to cite or link to this item: http://hdl.handle.net/10045/13917
Información del item - Informació de l'item - Item information
Title: Un análisis comparativo de estrategias para la categorización semántica de textos cortos
Other Titles: A comparative analysis of strategies for semantic short-text categorization
Authors: Rosas, María Verónica | Errecalde, Marcelo Luis | Rosso, Paolo
Keywords: Categorización de textos | Desambiguación | Ontología | Colecciones de textos cortos | Text categorization | Word sense disambiguation | Ontology | Short-text corpora
Knowledge Area: Lenguajes y Sistemas Informáticos
Issue Date: Apr-2010
Publisher: Sociedad Española para el Procesamiento del Lenguaje Natural
Citation: ROSAS, María V.; ERRECALDE, Marcelo L.; ROSSO, Paolo. “Un análisis comparativo de estrategias para la categorización semántica de textos cortos”. Procesamiento del Lenguaje Natural. N. 44 (abr. 2010). ISSN 1135-5948, pp. 11-18
Abstract: La categorización de textos cortos es, hoy en día un área importante de investigación debido a que gran parte de la información que recibimos y con la cual trabajamos habitualmente tiene esta característica (e-mails, mensajes de texto, resúmenes de noticias, entre otros). Distintos trabajos han reportado resultados interesantes en la categorización de textos incorporando información semántica a la representación de los documentos. Sin embargo, estos trabajos no se han concentrado en general en las particularidades que presentan los textos cortos. Por otra parte, los métodos de desambiguación más difundidos (basados en corpus) no siempre son adecuados en los dominios que se intentan abordar. En estos casos, la desambiguación basada en conocimiento se convierte en una alternativa interesante a considerar. En este trabajo, estudiamos la efectividad de la categorización de textos cortos, cuando se utiliza información semántica obtenida con métodos basados en conocimiento. Los resultados obtenidos con este enfoque muestran mejoras interesantes que incentivan a continuar con esta línea de investigación. | Nowadays, short-texts categorization is an important research area because most of the information we usually receive and work with have this characteristic (e-mails, text messages, news, etc.). Different studies have reported interesting results in text categorization by adding semantic information to documents’ representation. However, these studies have not focused on the particularities that short texts introduce. Furthermore, the most popular disambiguation methods (corpus-based methods) not always are feasible to use in these domains. Thus, knowledge-based disambiguation methods become interesting alternatives in these cases. In this article, we study the effectiveness of short text categorization, when semantic information, obtained by knowledge-based methods, is used. The results obtained with this approach show interesting improvements that encourage to continue this line of research.
Sponsor: Proyecto TEXT-ENTERPRISE 2.0 (TIN2009-13391-C04-03).
URI: http://hdl.handle.net/10045/13917
ISSN: 1135-5948
Language: spa
Type: info:eu-repo/semantics/article
Peer Review: si
Appears in Collections:Procesamiento del Lenguaje Natural - Nº 44 (abril 2010)

Files in This Item:
Files in This Item:
File Description SizeFormat 
ThumbnailPLN_44_01.pdf669,8 kBAdobe PDFOpen Preview


Items in RUA are protected by copyright, with all rights reserved, unless otherwise indicated.