MULTIMEDICA: extracción de información multilingüe en Sanidad y su aplicación a documentación divulgativa y científica
Empreu sempre aquest identificador per citar o enllaçar aquest ítem
http://hdl.handle.net/10045/18572
Títol: | MULTIMEDICA: extracción de información multilingüe en Sanidad y su aplicación a documentación divulgativa y científica |
---|---|
Títol alternatiu: | MULTIMEDICA: multilingual information extraction in Health domain and application to scientific and informative documents |
Autors: | Martínez Fernández, Paloma | González Cristóbal, José Carlos | Moreno Sandoval, Antonio |
Paraules clau: | Extracción de información | Tecnologías del lenguaje humano | Recursos terminológicos | Information extraction | Natural language technologies | Lexical resources |
Àrees de coneixement: | Lenguajes y Sistemas Informáticos |
Data de publicació: | de setembre-2011 |
Editor: | Sociedad Española para el Procesamiento del Lenguaje Natural |
Citació bibliogràfica: | MARTÍNEZ, Paloma; GONZÁLEZ-CRISTOBAL, José C.; MORENO SANDOVAL, Antonio. “MULTIMEDICA: extracción de información multilingüe en Sanidad y su aplicación a documentación divulgativa y científica”. Procesamiento del Lenguaje Natural. N. 47 (2011). ISSN 1135-5948, pp. 347-348 |
Resum: | El proyecto tiene como objetivo la definición y desarrollo de técnicas de extracción y búsqueda de información a partir de textos en el dominio biomédico, en particular, en dos líneas especiales: en primer lugar, el tratamiento de documentación científica en inglés sobre farmacología y en segundo lugar, el procesamiento de textos divulgativos sobre salud en idiomas como español y árabe. Estas técnicas de extracción incluyen el reconocimiento de entidades propias del dominio, aplicación de patrones y aprendizaje automático a la extracción de relaciones semánticas de interés y la integración de recursos léxicos específicos de sanidad (UMLS, SNOMED, etc.) para la mejora de aplicaciones. Por otro lado, la información extraída debe organizarse para su utilización en las herramientas de búsqueda e integración de información. | The aim of this project is to define and develop information extraction and retrieval techniques based on texts from the medical domain. This will be carried out following two basic tasks: firstly, processing scientific documents in English about pharmacology, and secondly, processing informative texts about health topics in other languages such as Spanish and Arabic. These information extraction techniques include domain entities recognition, pattern recognition, machine learning for extracting semantic relations, and the integration of lexical resources which are specific within the public health system (UMLS, SNOMED, etc.) in order to improve applications. On the other hand, the information extracted from the processing task must be used to enrich the information retrieval tools. |
Patrocinadors: | MULTIMEDICA (TIN2010-20644-C03). |
URI: | http://hdl.handle.net/10045/18572 |
ISSN: | 1135-5948 |
Idioma: | spa |
Tipus: | info:eu-repo/semantics/article |
Revisió científica: | si |
Apareix a la col·lecció: | Procesamiento del Lenguaje Natural - Nº 47 (2011) |
Arxius per aquest ítem:
Arxiu | Descripció | Tamany | Format | |
---|---|---|---|---|
PLN_47_50.pdf | 220,28 kB | Adobe PDF | Obrir Vista prèvia | |
Tots els documents dipositats a RUA estan protegits per drets d'autors. Alguns drets reservats.