ANALHITZA: a tool to extract linguistic information from large corpora in Humanities research

Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/10045/64033
Registro completo de metadatos
Registro completo de metadatos
Campo DCValorIdioma
dc.contributor.authorOtegi, Arantxa-
dc.contributor.authorImaz, Oier-
dc.contributor.authorDíaz de Ilarraza Sánchez, Arantza-
dc.contributor.authorIruskieta Quintian, Mikel-
dc.contributor.authorUria Garin, Larraitz-
dc.date.accessioned2017-03-07T11:01:55Z-
dc.date.available2017-03-07T11:01:55Z-
dc.date.issued2017-03-
dc.identifier.citationProcesamiento del Lenguaje Natural. 2017, 58: 77-84es_ES
dc.identifier.issn1135-5948-
dc.identifier.urihttp://hdl.handle.net/10045/64033-
dc.description.abstractEl tamaño reducido de los corpus en ciertos campos de investigación se debe a la falta de herramientas para procesar el lenguaje de forma masiva y sencilla. En este artículo presentamos ANALHITZA, una herramienta que estamos desarrollando dentro del proyecto Clarin-k que tiene como objetivo principal la creación de tecnologías lingüísticas útiles para la investigación en Ciencias Sociales y Humanidades. ANALHITZA ha sido diseñada para extraer información lingüística online de textos extensos de una forma sencilla. Además, es una herramienta multilingüe que permite analizar textos escritos en tres lenguas: euskera, castellano e inglés. En este artículo, a modo de ejemplo, presentamos tres estudios en los que se ha usado esta herramienta, que puede ser rediseñada para cubrir las necesidades de investigación de muchas de las ramas de Humanidades.es_ES
dc.description.abstractThe reduced size of corpora in some areas of research is due to the lack of tools to process massively and easily the language under study. In this article, we present ANALHITZA, a tool which is being developed within the Clarin-k project, whose aim is the creation of linguistic technologies that are useful for research on Social Sciences and Humanities. ANALHITZA has been designed to extract linguistic information online from large corpora in an easy way. Besides, it is a multilingual tool which can process texts written in three languages: Basque, Spanish and English. Moreover, we present three real examples of study where ANALHITZA has been used. The tool can be redesigned or changed, according to the needs of the scientific community in the field of Humanities.es_ES
dc.languageenges_ES
dc.publisherSociedad Española para el Procesamiento del Lenguaje Naturales_ES
dc.rights© Sociedad Española para el Procesamiento del Lenguaje Naturales_ES
dc.subjectHerramientaes_ES
dc.subjectTecnologías del lenguajees_ES
dc.subjectCorpuses_ES
dc.subjectAnálisis de textoes_ES
dc.subjectPoSes_ES
dc.subjectTooles_ES
dc.subjectLanguage technologieses_ES
dc.subjectCorporaes_ES
dc.subjectText analysises_ES
dc.subject.otherLenguajes y Sistemas Informáticoses_ES
dc.titleANALHITZA: a tool to extract linguistic information from large corpora in Humanities researches_ES
dc.title.alternativeANALHITZA: herramienta para extraer información lingüística de corpus extensos para su uso en investigaciones de ciencias humanases_ES
dc.typeinfo:eu-repo/semantics/articlees_ES
dc.peerreviewedsies_ES
dc.relation.publisherversionhttp://journal.sepln.org/sepln/ojs/ojs/index.php/plnes_ES
dc.rights.accessRightsinfo:eu-repo/semantics/openAccesses_ES
Aparece en las colecciones:Procesamiento del Lenguaje Natural - Nº 58 (2017)

Archivos en este ítem:
Archivos en este ítem:
Archivo Descripción TamañoFormato 
ThumbnailPLN_58_09.pdf430,12 kBAdobe PDFAbrir Vista previa


Todos los documentos en RUA están protegidos por derechos de autor. Algunos derechos reservados.