Corpus Viewer: NLP and ML-based Platform for Public Policy Making and Implementation

Empreu sempre aquest identificador per citar o enllaçar aquest ítem http://hdl.handle.net/10045/96627
Información del item - Informació de l'item - Item information
Títol: Corpus Viewer: NLP and ML-based Platform for Public Policy Making and Implementation
Títol alternatiu: Corpus Viewer: una plataforma basada en PLN y Aprendizaje Automático para diseño e implementación de política pública
Autors: Pérez-Fernández, David | Arenas-García, Jerónimo | Samy, Doaa | Padilla-Soler, Antonio | Gómez-Verdejo, Vanesa
Paraules clau: Topic modeling | Latent Dirichlet Allocation (LDA) | Graph analysis | Document Similarity | Automatic Classification | Dynamic topic analysis | Modelado de Tópicos | Análisis de Grafos | Similitud entre Documentos | Clasificación Automática | Modelado Dinámico de Tópicos
Àrees de coneixement: Lenguajes y Sistemas Informáticos
Data de publicació: de setembre-2019
Editor: Sociedad Española para el Procesamiento del Lenguaje Natural
Citació bibliogràfica: Procesamiento del Lenguaje Natural. 2019, 63: 193-196. doi:10.26342/2019-63-28
Resum: Corpus Viewer is a production service developed by the State Secretary for Digital Advancement (SEAD) within the framework of the National Language Technologies Plan (Plan TL), promoted by the same State Secretary. Corpus Viewer relies on Natural Language Processing (NLP), Machine Learning (ML) and Machine Translation (MT) to analyze structured metadata and unstructured textual data in large document corpora. The platform allows the decision maker and the policy implementer the possibility of analyze R&D&i information space (mainly patents, scientific publications and public aids) for evidence and knowledge-based policy making and implementation. In this paper, we describe the main functionalities of the platform and enumerate the techniques it is based on, which include a variety of methods like document topic modeling and graph analysis. | Corpus Viewer es un servicio en producción desarrollado por la Secretaría de Estado del Avance Digital dentro del marco del Plan de Impulso de Tecnologías del Lenguaje (Plan TL). Se basa en técnicas de Procesamiento del Lenguaje Natural (PLN) y Aprendizaje Automático para analizar datos estructurados y no-estructurados en grandes colecciones de documentos como las patentes, las publicaciones científicas de acceso abierto, los proyectos europeos, etc. El objetivo es ofrecer al decisor político y al gestor la posibilidad de navegar en el espacio de la información teniendo una visión de conjunto que le ayude a tomar decisiones basadas en conocimiento y evidencias. En este artículo, se describen las funcionalidades básicas de la plataforma enumerando las técnicas empleadas que incluyen, entre otros, modelados de tópicos y análisis de grafos.
Patrocinadors: This work has been carried out in the framework of the Spanish State Plan for Natural Language Technologies. We would like to acknowledge the different organizations that have contributed to the project under the SEAD-SEUIDI-FECYT agreement for Competitive Intelligence: UPM, IIC, UPF, IXA UPV, Elhuyar. The work of J. Arenas-García and V. Gómez-Verdejo has been partly funded by MINECO projects TEC2014-52289-R and TEC2017-83838-R.
URI: http://hdl.handle.net/10045/96627
ISSN: 1135-5948
DOI: 10.26342/2019-63-28
Idioma: eng
Tipus: info:eu-repo/semantics/article
Drets: © Sociedad Española para el Procesamiento del Lenguaje Natural
Revisió científica: si
Versió de l'editor: https://doi.org/10.26342/2019-63-28
Apareix a la col·lecció: Procesamiento del Lenguaje Natural - Nº 63 (2019)

Arxius per aquest ítem:
Arxius per aquest ítem:
Arxiu Descripció Tamany Format  
ThumbnailPLN_63_28.pdf2,52 MBAdobe PDFObrir Vista prèvia


Tots els documents dipositats a RUA estan protegits per drets d'autors. Alguns drets reservats.