A Combination based on OWA Operators for Multi-label Genre Classification of web pages
Please use this identifier to cite or link to this item:
http://hdl.handle.net/10045/45489
Title: | A Combination based on OWA Operators for Multi-label Genre Classification of web pages |
---|---|
Other Titles: | Una combinación basada en operadores OWA para la Clasificación de Género Multi-etiqueta de páginas web |
Authors: | Jebari, Chaker |
Keywords: | OWA | Combination | Multi-label | Classifier | Genre | Web page | Combinación | Multi-etiqueta | Clasificadores | Género | Página web |
Knowledge Area: | Lenguajes y Sistemas Informáticos |
Issue Date: | Mar-2015 |
Publisher: | Sociedad Española para el Procesamiento del Lenguaje Natural |
Citation: | Procesamiento del Lenguaje Natural. 2015, 54: 13-20 |
Abstract: | This paper presents a new method for genre identification that combines homogeneous classifiers using OWA (Ordered Weighted Averaging) operators. Our method uses character n-grams extracted from different information sources such as URL, title, headings and anchors. To deal with the complexity of web pages, we applied MLKNN as a multi-label classifier, in which a web page can be affected by more than one genre. Experiments conducted using a known multi-label corpus show that our method achieves good results. | En este trabajo se presenta un nuevo método para la identificación de género que combina clasificadores homogéneos utilizando OWA (promedio ponderado) Pedimos operadores. Nuestro método utiliza caracteres n-gramas extraídos de diferentes fuentes de información, tales como URL, título, encabezados y anclajes. Para hacer frente a la complejidad de las páginas web, se aplicó MLKNN como un clasificador multi-etiqueta, en el que una página web puede verse afectada por más de un género. Los experimentos llevados a cabo usando un conocido corpus multi-etiqueta muestran que nuestro método logra buenos resultados. |
URI: | http://hdl.handle.net/10045/45489 |
ISSN: | 1135-5948 |
Language: | eng |
Type: | info:eu-repo/semantics/article |
Rights: | © Sociedad Española para el Procesamiento del Lenguaje Natural |
Peer Review: | si |
Publisher version: | http://journal.sepln.org/sepln/ojs/ojs/index.php/pln |
Appears in Collections: | Procesamiento del Lenguaje Natural - Nº 54 (2015) |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
PLN_54_01.pdf | 926,42 kB | Adobe PDF | Open Preview | |
Items in RUA are protected by copyright, with all rights reserved, unless otherwise indicated.