Corpus Viewer: NLP and ML-based Platform for Public Policy Making and Implementation

Please use this identifier to cite or link to this item: http://hdl.handle.net/10045/96627
Información del item - Informació de l'item - Item information
Title: Corpus Viewer: NLP and ML-based Platform for Public Policy Making and Implementation
Other Titles: Corpus Viewer: una plataforma basada en PLN y Aprendizaje Automático para diseño e implementación de política pública
Authors: Pérez-Fernández, David | Arenas-García, Jerónimo | Samy, Doaa | Padilla-Soler, Antonio | Gómez-Verdejo, Vanesa
Keywords: Topic modeling | Latent Dirichlet Allocation (LDA) | Graph analysis | Document Similarity | Automatic Classification | Dynamic topic analysis | Modelado de Tópicos | Análisis de Grafos | Similitud entre Documentos | Clasificación Automática | Modelado Dinámico de Tópicos
Knowledge Area: Lenguajes y Sistemas Informáticos
Issue Date: Sep-2019
Publisher: Sociedad Española para el Procesamiento del Lenguaje Natural
Citation: Procesamiento del Lenguaje Natural. 2019, 63: 193-196. doi:10.26342/2019-63-28
Abstract: Corpus Viewer is a production service developed by the State Secretary for Digital Advancement (SEAD) within the framework of the National Language Technologies Plan (Plan TL), promoted by the same State Secretary. Corpus Viewer relies on Natural Language Processing (NLP), Machine Learning (ML) and Machine Translation (MT) to analyze structured metadata and unstructured textual data in large document corpora. The platform allows the decision maker and the policy implementer the possibility of analyze R&D&i information space (mainly patents, scientific publications and public aids) for evidence and knowledge-based policy making and implementation. In this paper, we describe the main functionalities of the platform and enumerate the techniques it is based on, which include a variety of methods like document topic modeling and graph analysis. | Corpus Viewer es un servicio en producción desarrollado por la Secretaría de Estado del Avance Digital dentro del marco del Plan de Impulso de Tecnologías del Lenguaje (Plan TL). Se basa en técnicas de Procesamiento del Lenguaje Natural (PLN) y Aprendizaje Automático para analizar datos estructurados y no-estructurados en grandes colecciones de documentos como las patentes, las publicaciones científicas de acceso abierto, los proyectos europeos, etc. El objetivo es ofrecer al decisor político y al gestor la posibilidad de navegar en el espacio de la información teniendo una visión de conjunto que le ayude a tomar decisiones basadas en conocimiento y evidencias. En este artículo, se describen las funcionalidades básicas de la plataforma enumerando las técnicas empleadas que incluyen, entre otros, modelados de tópicos y análisis de grafos.
Sponsor: This work has been carried out in the framework of the Spanish State Plan for Natural Language Technologies. We would like to acknowledge the different organizations that have contributed to the project under the SEAD-SEUIDI-FECYT agreement for Competitive Intelligence: UPM, IIC, UPF, IXA UPV, Elhuyar. The work of J. Arenas-García and V. Gómez-Verdejo has been partly funded by MINECO projects TEC2014-52289-R and TEC2017-83838-R.
URI: http://hdl.handle.net/10045/96627
ISSN: 1135-5948
DOI: 10.26342/2019-63-28
Language: eng
Type: info:eu-repo/semantics/article
Rights: © Sociedad Española para el Procesamiento del Lenguaje Natural
Peer Review: si
Publisher version: https://doi.org/10.26342/2019-63-28
Appears in Collections:Procesamiento del Lenguaje Natural - Nº 63 (2019)

Files in This Item:
Files in This Item:
File Description SizeFormat 
ThumbnailPLN_63_28.pdf2,52 MBAdobe PDFOpen Preview


Items in RUA are protected by copyright, with all rights reserved, unless otherwise indicated.