A Combination based on OWA Operators for Multi-label Genre Classification of web pages

Please use this identifier to cite or link to this item: http://hdl.handle.net/10045/45489
Información del item - Informació de l'item - Item information
Title: A Combination based on OWA Operators for Multi-label Genre Classification of web pages
Other Titles: Una combinación basada en operadores OWA para la Clasificación de Género Multi-etiqueta de páginas web
Authors: Jebari, Chaker
Keywords: OWA | Combination | Multi-label | Classifier | Genre | Web page | Combinación | Multi-etiqueta | Clasificadores | Género | Página web
Knowledge Area: Lenguajes y Sistemas Informáticos
Issue Date: Mar-2015
Publisher: Sociedad Española para el Procesamiento del Lenguaje Natural
Citation: Procesamiento del Lenguaje Natural. 2015, 54: 13-20
Abstract: This paper presents a new method for genre identification that combines homogeneous classifiers using OWA (Ordered Weighted Averaging) operators. Our method uses character n-grams extracted from different information sources such as URL, title, headings and anchors. To deal with the complexity of web pages, we applied MLKNN as a multi-label classifier, in which a web page can be affected by more than one genre. Experiments conducted using a known multi-label corpus show that our method achieves good results. | En este trabajo se presenta un nuevo método para la identificación de género que combina clasificadores homogéneos utilizando OWA (promedio ponderado) Pedimos operadores. Nuestro método utiliza caracteres n-gramas extraídos de diferentes fuentes de información, tales como URL, título, encabezados y anclajes. Para hacer frente a la complejidad de las páginas web, se aplicó MLKNN como un clasificador multi-etiqueta, en el que una página web puede verse afectada por más de un género. Los experimentos llevados a cabo usando un conocido corpus multi-etiqueta muestran que nuestro método logra buenos resultados.
URI: http://hdl.handle.net/10045/45489
ISSN: 1135-5948
Language: eng
Type: info:eu-repo/semantics/article
Rights: © Sociedad Española para el Procesamiento del Lenguaje Natural
Peer Review: si
Publisher version: http://journal.sepln.org/sepln/ojs/ojs/index.php/pln
Appears in Collections:Procesamiento del Lenguaje Natural - Nº 54 (2015)

Files in This Item:
Files in This Item:
File Description SizeFormat 
ThumbnailPLN_54_01.pdf926,42 kBAdobe PDFOpen Preview


Items in RUA are protected by copyright, with all rights reserved, unless otherwise indicated.