NLP applied to occupational health: MEDDOPROF shared task at IberLEF 2021 on automatic recognition, classification and normalization of professions and occupations from medical texts

Empreu sempre aquest identificador per citar o enllaçar aquest ítem http://hdl.handle.net/10045/117495
Información del item - Informació de l'item - Item information
Títol: NLP applied to occupational health: MEDDOPROF shared task at IberLEF 2021 on automatic recognition, classification and normalization of professions and occupations from medical texts
Títol alternatiu: PLN aplicado a salud laboral: tarea MEDDOPROF en IberLEF 2021 sobre detección, clasificación y normalización automática de profesiones y ocupaciones en textos médicos
Autors: Lima-López, Salvador | Farré-Maduell, Eulàlia | Miranda-Escalada, Antonio | Brivá-Iglesias, Vicent | Krallinger, Martin
Paraules clau: Tarea compartida | Dominio clínico | Ocupaciones | Castellano | Shared task | Clinical domain | Occupations | Spanish
Àrees de coneixement: Lenguajes y Sistemas Informáticos
Data de publicació: de setembre-2021
Editor: Sociedad Española para el Procesamiento del Lenguaje Natural
Citació bibliogràfica: Procesamiento del Lenguaje Natural. 2021, 67: 243-256. https://doi.org/10.26342/2021-67-21
Resum: Entre las características sociodemográficas de los pacientes, las ocupaciones juegan un papel fundamental tanto desde el punto de vista de la salud laboral, accidentes laborales y exposición a tóxicos y patógenos como desde el de la salud física y mental. Este artículo presenta la tarea Medical Documents Profession Recognition (MEDDOPROF), celebrada dentro de IberLEF/SEPLN 2021. La tarea se centra en el reconocimiento y detección de ocupaciones en textos médicos en castellano. MEDDOPROF propone tres retos: NER (reconocimiento de profesiones, situaciones laborales y actividades), CLASS (clasificar cada ocupación en función de su referente, como puede ser el paciente o un familiar) y NORM (normalizar menciones a las terminologías ESCO y SNOMED-CT). De un total de 40 equipos registrados, 15 han presentado un total de 94 sistemas. Los sistemas de mejor rendimiento se basan en tecnologías de aprendizaje profundo como transformers, llegando a conseguir una F-score de 0.818 en detección de ocupaciones (NER), 0.793 en clasificación de ocupaciones por su referente (CLASS) y 0.619 en normalización (NORM). Futuras iniciativas deberían tener también en cuenta aspectos multilingües y la aplicación en otros dominios como servicios sociales, recursos humanos, análisis del mercado legal y laboral o la política. | Among the socio-demographic patient characteristics, occupations play an important role regarding not only occupational health, work-related accidents and exposure to toxic/pathogenic agents, but also their impact on general physical and mental health. This paper presents the Medical Documents Profession Recognition (MEDDOPROF) shared task (held within IberLEF/SEPLN 2021), focused on the recognition and normalization of occupations in medical documents in Spanish. MEDDOPROF proposes three challenges: NER (recognition of professions, employment statuses and activities in text), CLASS (classifying each occupation mention to its holder, i.e. patient or family member) and NORM (normalizing mentions to their identifier in ESCO or SNOMED CT). From the total of 40 registered teams, 15 submitted a total of 94 runs for the various sub-tracks. Best-performing systems were based on deep-learning technologies (incl. transformers) and achieved 0.818 F-score in occupation detection (NER), 0.793 in classifying occupations to their referent (CLASS) and 0.619 in normalization (NORM). Future initiatives should also address multilingual aspects and application to other domains like social services, human resources, legal or job market data analytics and policy makers.
Patrocinadors: MEDDOPROF was promoted through the collaboration between the Spanish Plan for the Advancement of Language Technology (Plan TL) and the BSC. We also want to acknowledge the 2020 Proyectos de I+D+I - RTI Tipo A (DESCIFRANDO EL PAPEL DE LAS PROFESIONES EN LA SALUD DE LOS PACIENTES A TRAVES DE LA MINERIA DE TEXTOS (PID2020-119266RA-I00)) for support.
URI: http://hdl.handle.net/10045/117495
ISSN: 1135-5948
DOI: 10.26342/2021-67-21
Idioma: eng
Tipus: info:eu-repo/semantics/article
Drets: © Sociedad Española para el Procesamiento del Lenguaje Natural
Revisió científica: si
Versió de l'editor: https://doi.org/10.26342/2021-67-21
Apareix a la col·lecció: Procesamiento del Lenguaje Natural - Nº 67 (2021)

Arxius per aquest ítem:
Arxius per aquest ítem:
Arxiu Descripció Tamany Format  
ThumbnailPLN_67_21.pdf1,55 MBAdobe PDFObrir Vista prèvia


Tots els documents dipositats a RUA estan protegits per drets d'autors. Alguns drets reservats.