Determinación del umbral de representatividad de un corpus mediante el algoritmo N-Cor
Por favor, use este identificador para citar o enlazar este ítem:
http://hdl.handle.net/10045/2997
Registro completo de metadatos
Campo DC | Valor | Idioma |
---|---|---|
dc.contributor.author | Corpas Pastor, Gloria | - |
dc.contributor.author | Seghiri Domínguez, Míriam | - |
dc.date.accessioned | 2007-11-14T16:46:14Z | - |
dc.date.available | 2007-11-14T16:46:14Z | - |
dc.date.issued | 2007-09 | - |
dc.identifier.citation | CORPAS PASTOR, Gloria; SEGHIRI DOMÍNGUEZ, Míriam. "Determinación del umbral de representatividad de un corpus mediante el algoritmo N-Cor". Procesamiento del lenguaje natural. N. 39 (sept. 2007). ISSN 1135-5948, pp. 165-172 | en |
dc.identifier.issn | 1135-5948 | - |
dc.identifier.uri | http://hdl.handle.net/10045/2997 | - |
dc.description.abstract | En las páginas que siguen a continuación vamos a describir un método para calcular el umbral mínimo de representatividad de un corpus mediante el algoritmo N-Cor de análisis de la densidad léxica en función del aumento incremental del corpus. Se trata de una solución eficaz para determinar a posteriori, por primera vez de forma objetiva y cuantificable, el tamaño mínimo que debe alcanzar un corpus para que sea considerado representativo en términos estadísticos. Este método se ha visto implementado en la aplicación informática ReCor. Con dicha herramienta vamos a comprobar si un corpus de seguros turísticos en español que hemos compilado sería representativo para realizar estudios lingüístico-textuales y poder ser utilizarlo en traducción. | en |
dc.description.abstract | In this paper we describe a method to determine the representativeness threshold for any given corpus. By using the N-Cor algorithm it is possible to quantify a posteriori the minimum number of documents and words that should be included in a specialised language corpus, in order that it may be considered representative. This method has been implemented by means of a computer program (ReCor). This program will be used here to check whether a corpus of insurance policies in Spanish is representative enough in order to carry out textlinguistic studies and translation tasks. | en |
dc.description.sponsorship | El presente trabajo ha sido realizado en el seno del proyecto La contratación turística electrónica multilingüe como mediación intercultural: aspectos legales, traductológicos y terminológicos (Ref. nº HUM-892, 2006-2009. Proyecto de Excelencia, Junta de Andalucía) | en |
dc.language | spa | en |
dc.publisher | Sociedad Española para el Procesamiento del Lenguaje Natural | en |
dc.relation.ispartof | Procesamiento del lenguaje natural, nº 39 (sept. 2007), pp. 165-172 | en |
dc.subject | Representatividad | en |
dc.subject | Lingüística de corpus | en |
dc.subject | Compilación de corpus | en |
dc.subject | Corpus especializado | en |
dc.subject | Representativeness | en |
dc.subject | Corpus linguistics | en |
dc.subject | Corpus compilation | en |
dc.subject | Specialised corpus | en |
dc.title | Determinación del umbral de representatividad de un corpus mediante el algoritmo N-Cor | en |
dc.type | info:eu-repo/semantics/article | en |
dc.rights.accessRights | info:eu-repo/semantics/openAccess | - |
Aparece en las colecciones: | Procesamiento del Lenguaje Natural - Nº 39 (septiembre 2007) |
Archivos en este ítem:
Archivo | Descripción | Tamaño | Formato | |
---|---|---|---|---|
PLN_39_20.pdf | 290,81 kB | Adobe PDF | Abrir Vista previa | |
Todos los documentos en RUA están protegidos por derechos de autor. Algunos derechos reservados.