Inducción automática de una taxonomía multilingüe de marcadores discursivos: primeros resultados en castellano, inglés, francés, alemán y catalán

Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/10045/117488
Registro completo de metadatos
Registro completo de metadatos
Campo DCValorIdioma
dc.contributor.authorNazar, Rogelio-
dc.date.accessioned2021-09-02T15:11:04Z-
dc.date.available2021-09-02T15:11:04Z-
dc.date.issued2021-09-
dc.identifier.citationProcesamiento del Lenguaje Natural. 2021, 67: 127-138. https://doi.org/10.26342/2021-67-11es_ES
dc.identifier.issn1135-5948-
dc.identifier.urihttp://hdl.handle.net/10045/117488-
dc.description.abstractEste artículo presenta una propuesta metodológica para la inducción automática de una taxonomía multilingüe de marcadores discursivos, que en el caso del castellano corresponden a unidades tales como sin embargo, por lo tanto, por un lado, etc. Se propone primeramente un método para separar estas unidades del resto del vocabulario por medio del cálculo de su cantidad de información, seguido de su agrupación en categorías funcionales mediante un corpus paralelo. Finalmente, esta categorización se utiliza como base para la obtención y clasificación de nuevas unidades. Además del método, se describen los primeros resultados, consistentes en una base de datos que actualmente supera ya los 2.600 marcadores.es_ES
dc.description.abstractThis paper presents a methodological proposal por the automatic induction of a multilingual taxonomy of discourse markers which, in the case of English, correspond to units such as however, therefore, by the way, etc. First, a method is proposed to separate such units from the rest of the vocabulary using a measure of information, followed by a method to group them using a parallel corpus. Finally, this categorization is used as the basis for the extraction and classification of new units. Apart from the method, the first results are described, which consist of a database that currently surpasses 2600 units.es_ES
dc.description.sponsorshipEsta investigación ha sido financiada por el Gobierno de Chile a través del Proyecto Fondecyt Regular 1191481: Inducción automática de taxonomías de marcadores discursivos a partir de corpus multilingües (2019-2021).es_ES
dc.languagespaes_ES
dc.publisherSociedad Española para el Procesamiento del Lenguaje Naturales_ES
dc.rights© Sociedad Española para el Procesamiento del Lenguaje Naturales_ES
dc.subjectInducción de taxonomíases_ES
dc.subjectMarcadores discursivoses_ES
dc.subjectPartículas del discursoes_ES
dc.subjectLexicografía computacionales_ES
dc.subjectTaxonomy inductiones_ES
dc.subjectDiscourse markerses_ES
dc.subjectDiscurse particleses_ES
dc.subjectComputational lexicographyes_ES
dc.subject.otherLenguajes y Sistemas Informáticoses_ES
dc.titleInducción automática de una taxonomía multilingüe de marcadores discursivos: primeros resultados en castellano, inglés, francés, alemán y catalánes_ES
dc.title.alternativeAutomatic induction of a multilingual taxonomy of discourse markers: first results in Spanish, English, French, German and Catalanes_ES
dc.typeinfo:eu-repo/semantics/articlees_ES
dc.peerreviewedsies_ES
dc.identifier.doi10.26342/2021-67-11-
dc.relation.publisherversionhttps://doi.org/10.26342/2021-67-11es_ES
dc.rights.accessRightsinfo:eu-repo/semantics/openAccesses_ES
Aparece en las colecciones:Procesamiento del Lenguaje Natural - Nº 67 (2021)

Archivos en este ítem:
Archivos en este ítem:
Archivo Descripción TamañoFormato 
ThumbnailPLN_67_11.pdf774,22 kBAdobe PDFAbrir Vista previa


Todos los documentos en RUA están protegidos por derechos de autor. Algunos derechos reservados.