Fundamentos de Latent Semantic Indexing (LSI) y su aplicación a la categorización de textos periodísticos en euskara

Zelaia Jauregi, Ana Victoria

Fundamentos de Latent Semantic Indexing (LSI) y su aplicación a la categorización de textos periodísticos en euskara

Empreu sempre aquest identificador per citar o enllaçar aquest ítem http://hdl.handle.net/10045/1480

Información del item - Informació de l'item - Item information
Títol:	Fundamentos de Latent Semantic Indexing (LSI) y su aplicación a la categorización de textos periodísticos en euskara
Autors:	Zelaia Jauregi, Ana Victoria
Paraules clau:	Descomposición en valores singulares \| Latent Semantic Indexing \| Singular value decomposition
Data de publicació:	de març-2004
Editor:	Sociedad Española para el Procesamiento del Lenguaje Natural
Citació bibliogràfica:	ZELAIA JAUREGI, Ana Victoria. “Fundamentos de Latent Semantic Indexing (LSI) y su aplicación a la categorización de textos periodísticos en euskara”. Procesamiento del lenguaje natural. Nº 32 (marzo 2004), pp. 67-74
Resum:	Muchos métodos de búsqueda de textos en Internet dependen de un emparejamiento exacto entre palabras que busca el usuario y las que existen en el documento. La descomposición en valores singulares utilizada por LSI permite recuperar información basada en conceptos o significados que están latentes en el documento. En este artículo se analizan los fundamentos matemáticos de dicha técnica, y se muestran unos resultados obtenidos para un experimento de categorización de textos. Además, se citan algunas aplicaciones de LSI para el procesamiento del lenguaje natural. \| Currently, most approaches to retrieving textual materials from scientific databases depend on a lexical match between words in user's requests and those in document in a database. Using the singular value decomposition, LSI takes advantage of the implicit higher-order structure in the association of terms with documents. Here we describe the mathematical foundations of this technique, and show the results that we have obtained by applying it to a text categorization experiment. Moreover, we note the applications of LSI in NLP.
Patrocinadors:	Los experimentos descritos se enmarcan en el proyecto "Aplicación de técnicas basadas en el aprendizaje automático para la clasificación y recuperación de documentos escritos en euskara" que ha sido parcialmente subvencionado por el Gobierno Vasco dentro del programa Universidad-Empresa (Código UE02/B11), por la Universidad del País Vasco UPV00141.226-T-14816/2002 y por la Diputación de Gipuzkoa dentro de un programa de la Comunidad Europea.
URI:	http://hdl.handle.net/10045/1480
ISSN:	1135-5948
Idioma:	spa
Tipus:	info:eu-repo/semantics/article
Apareix a la col·lecció:	Procesamiento del Lenguaje Natural - Nº 32 (marzo 2004)

Arxius per aquest ítem:

Arxius per aquest ítem:
Arxiu	Descripció	Tamany	Format
PLN_32_05.pdf		236,31 kB	Adobe PDF	Obrir Vista prèvia Tancar vista prèvia

Veure citacions a Google Académic

Mostrar el registre complet de l'ítem

Tots els documents dipositats a RUA estan protegits per drets d'autors. Alguns drets reservats.