Mosquera López, Alejandro, Moreda, Paloma Caracterización de niveles de informalidad en textos de la Web 2.0 MOSQUERA, Alejandro; MOREDA, Paloma. “Caracterización de niveles de informalidad en textos de la Web 2.0”. Procesamiento del Lenguaje Natural. N. 47 (2011). ISSN 1135-5948, pp. 171-177 URI: http://hdl.handle.net/10045/18525 DOI: ISSN: 1135-5948 Abstract: El análisis de textos de la Web 2.0 es un tema de investigación relevante hoy en día. Sin embargo, son muchos los problemas que se plantean a la hora de utilizar las herramientas actuales en este tipo de textos. Para ser capaces de medir estas dificultades primero necesitamos conocer los diferentes registros o grados de informalidad que podemos encontrar. Por ello, en este trabajo intentaremos caracterizar niveles de informalidad para textos en inglés en la Web 2.0 mediante técnicas de aprendizaje automático no supervisado, obteniendo resultados del 68 % en F1. Analysis of Web 2.0 texts is a relevant investigation topic nowadays. However, many problems arise when using state of the art tools in this kind of texts. For being able to measure these difficulties first we need to identify the different registers or informality levels that we can find. Therefore, in this paper we will attempt to characterize the informality levels of english texts in Web 2.0 by using non-supervised machine learning techniques, obtaining results of 68 % in F1. Keywords:Clustering, Registros del lenguaje, Web 2.0, Language registers Sociedad Española para el Procesamiento del Lenguaje Natural info:eu-repo/semantics/article