Landscaping Language Technologies using Topic Modeling and Graph Analysis: Overview of the Spanish Contribution

Empreu sempre aquest identificador per citar o enllaçar aquest ítem http://hdl.handle.net/10045/96602
Información del item - Informació de l'item - Item information
Títol: Landscaping Language Technologies using Topic Modeling and Graph Analysis: Overview of the Spanish Contribution
Títol alternatiu: Caracterización del sector de Tecnologías del Lenguaje mediante modelado de tópicos y análisis de grafos: Visión general de la participación española
Autors: Samy, Doaa | Pérez-Fernández, David | Arenas-García, Jerónimo
Paraules clau: Human Language Technologies | Topic Modeling | Latent Dirichlet Allocation (LDA) | Louvain modularity algorithm | Natural Language Processing | Tecnologías del Lenguaje | Modelado de Tópicos | Algoritmo de modularidad de Louvain | Procesamiento del Lenguaje Natural
Àrees de coneixement: Lenguajes y Sistemas Informáticos
Data de publicació: de setembre-2019
Editor: Sociedad Española para el Procesamiento del Lenguaje Natural
Citació bibliogràfica: Procesamiento del Lenguaje Natural. 2019, 63: 129-136. doi:10.26342/2019-63-14
Resum: This paper aims at landscaping the Human Language Technologies (HLT) sector by applying topic modeling and graph analysis to study the scientific literature in ACL Anthology with special emphasis on the Spanish participation. The analysis takes into account the structured and unstructured data to offer an overview of the HLT landscape in Spain identifying main underlying themes and its evolution in the last years compared to the international HLT community. Results obtained are represented through an interactive visualization to allow the exploration of the HLT landscape in the time frame 1983-2018. | El presente trabajo aplica herramientas de modelado de tópicos y análisis de grafos para caracterizar el sector de Tecnologías del Lenguaje (TL) en España. Para ello, se estudian el repositorio de ACL Anthology. Este análisis tiene en cuenta los datos estructurados y no-estructurados en dichas fuentes con el fin de retratar el panorama actual en términos de temáticas subyacentes y su evolución en los últimos años en comparación con la comunidad internacional. Los resultados se presentan mediante una visualización interactiva que permite navegar en el espacio de TL en el intervalo temporal 1983-2018.
Patrocinadors: This work has been carried out in the framework of the Spanish State Plan for Natural Language Technologies. The work of J. Arenas-García has also been partly funded by MINECO projects TEC2014-52289-R and TEC2017-83838-R.
URI: http://hdl.handle.net/10045/96602
ISSN: 1135-5948
DOI: 10.26342/2019-63-14
Idioma: eng
Tipus: info:eu-repo/semantics/article
Drets: © Sociedad Española para el Procesamiento del Lenguaje Natural
Revisió científica: si
Versió de l'editor: https://doi.org/10.26342/2019-63-14
Apareix a la col·lecció: Procesamiento del Lenguaje Natural - Nº 63 (2019)

Arxius per aquest ítem:
Arxius per aquest ítem:
Arxiu Descripció Tamany Format  
ThumbnailPLN_63_14.pdf1,85 MBAdobe PDFObrir Vista prèvia


Tots els documents dipositats a RUA estan protegits per drets d'autors. Alguns drets reservats.