Determinación del umbral de representatividad de un corpus mediante el algoritmo N-Cor

Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/10045/2997
Registro completo de metadatos
Registro completo de metadatos
Campo DCValorIdioma
dc.contributor.authorCorpas Pastor, Gloria-
dc.contributor.authorSeghiri Domínguez, Míriam-
dc.date.accessioned2007-11-14T16:46:14Z-
dc.date.available2007-11-14T16:46:14Z-
dc.date.issued2007-09-
dc.identifier.citationCORPAS PASTOR, Gloria; SEGHIRI DOMÍNGUEZ, Míriam. "Determinación del umbral de representatividad de un corpus mediante el algoritmo N-Cor". Procesamiento del lenguaje natural. N. 39 (sept. 2007). ISSN 1135-5948, pp. 165-172en
dc.identifier.issn1135-5948-
dc.identifier.urihttp://hdl.handle.net/10045/2997-
dc.description.abstractEn las páginas que siguen a continuación vamos a describir un método para calcular el umbral mínimo de representatividad de un corpus mediante el algoritmo N-Cor de análisis de la densidad léxica en función del aumento incremental del corpus. Se trata de una solución eficaz para determinar a posteriori, por primera vez de forma objetiva y cuantificable, el tamaño mínimo que debe alcanzar un corpus para que sea considerado representativo en términos estadísticos. Este método se ha visto implementado en la aplicación informática ReCor. Con dicha herramienta vamos a comprobar si un corpus de seguros turísticos en español que hemos compilado sería representativo para realizar estudios lingüístico-textuales y poder ser utilizarlo en traducción.en
dc.description.abstractIn this paper we describe a method to determine the representativeness threshold for any given corpus. By using the N-Cor algorithm it is possible to quantify a posteriori the minimum number of documents and words that should be included in a specialised language corpus, in order that it may be considered representative. This method has been implemented by means of a computer program (ReCor). This program will be used here to check whether a corpus of insurance policies in Spanish is representative enough in order to carry out textlinguistic studies and translation tasks.en
dc.description.sponsorshipEl presente trabajo ha sido realizado en el seno del proyecto La contratación turística electrónica multilingüe como mediación intercultural: aspectos legales, traductológicos y terminológicos (Ref. nº HUM-892, 2006-2009. Proyecto de Excelencia, Junta de Andalucía)en
dc.languagespaen
dc.publisherSociedad Española para el Procesamiento del Lenguaje Naturalen
dc.relation.ispartofProcesamiento del lenguaje natural, nº 39 (sept. 2007), pp. 165-172en
dc.subjectRepresentatividaden
dc.subjectLingüística de corpusen
dc.subjectCompilación de corpusen
dc.subjectCorpus especializadoen
dc.subjectRepresentativenessen
dc.subjectCorpus linguisticsen
dc.subjectCorpus compilationen
dc.subjectSpecialised corpusen
dc.titleDeterminación del umbral de representatividad de un corpus mediante el algoritmo N-Coren
dc.typeinfo:eu-repo/semantics/articleen
dc.rights.accessRightsinfo:eu-repo/semantics/openAccess-
Aparece en las colecciones:Procesamiento del Lenguaje Natural - Nº 39 (septiembre 2007)

Archivos en este ítem:
Archivos en este ítem:
Archivo Descripción TamañoFormato 
ThumbnailPLN_39_20.pdf290,81 kBAdobe PDFAbrir Vista previa


Todos los documentos en RUA están protegidos por derechos de autor. Algunos derechos reservados.