Logo Repositorio Institucional

Por favor, use este identificador para citar o enlazar este ítem: https://dspace.ucuenca.edu.ec/handle/123456789/35471
Título : A ranking-based approach for supporting the initial selection of primary studies in a Systematic Literature Review
Autor: Freire Zurita, Renan Gonzalo
Gonzalez Toral, Hernan Santiago
Saquicela Galarza, Victor Hugo
Gualan Saavedra, Ronald Marcelo
Palabras clave : machinelearning
data mining
ranking indexing
Systematic literature review
knowledge graphs
NLPPCA
text mining
automation
Área de conocimiento FRASCATI amplio: 2. Ingeniería y Tecnología
Área de conocimiento FRASCATI detallado: 2.2.4 Ingeniería de La Comunicación y de Sistemas
Área de conocimiento FRASCATI específico: 2.2 Ingenierias Eléctrica, Electrónica e Información
Área de conocimiento UNESCO amplio: 06 - Información y Comunicación (TIC)
ÁArea de conocimiento UNESCO detallado: 0613 - Software y Desarrollo y Análisis de Aplicativos
Área de conocimiento UNESCO específico: 061 - Información y Comunicación (TIC)
Fecha de publicación : 2019
Fecha de fin de embargo: 31-dic-2050
Volumen: September 2019
Fuente: Proceedings - 2019 45th Latin American Computing Conference, CLEI 2019
metadata.dc.identifier.doi: 10.1109/CLEI47609.2019.235079
Editor: Institute of Electrical and Electronics Engineers Inc.
Ciudad: 
Panamá
Tipo: ARTÍCULO DE CONFERENCIA
Abstract: 
Traditionally most of the steps involved in a Systematic Literature Review (SLR) process are manually executed, causing inconvenience of time and effort, given the massive amount of primary studies available online. This has motivated a lot of research focused on automating the process. Current state-of-the-art methods combine active learning methods and manual selection of primary studies from a smaller set so they can maximize the finding of relevant papers while at the same time minimizing the number of manually reviewed papers. In this work, we propose a novel strategy to further improve these methods whose early success heavily depends on an effective selection of initial papers to be read by researchers using a PCAbased method which combines different document representation and similarity metric approaches to cluster and rank the content within the corpus related to an enriched representation of research questions within the SLR protocol. Validation was carried out over four publicly available data sets corresponding to SLR studies from the Software Engineering domain. The proposed model proved to be more efficient than a BM25 baseline model as a mechanism to select the initial set of relevant primary studies within the top 100 rank, which makes it a promising method to bootstrap an active learning cycle.
URI : http://dspace.ucuenca.edu.ec/handle/123456789/35471
https://www.scopus.com/inward/record.uri?eid=2-s2.0-85084734905&doi=10.1109%2fCLEI47609.2019.235079&partnerID=40&md5=dda5a12dd48231eea588da4d463b39b4
URI Fuente: https://ieeexplore.ieee.org/xpl/conhome/9042768/proceeding
ISBN : 978-172815574-6
ISSN : 0000-0000
Aparece en las colecciones: Artículos

Ficheros en este ítem:
Fichero Descripción Tamaño Formato  
documento.pdf
  Until 2050-12-31
document227.8 kBAdobe PDFVisualizar/Abrir     Solicitar una copia


Este ítem está protegido por copyright original



Los ítems de DSpace están protegidos por copyright, con todos los derechos reservados, a menos que se indique lo contrario.

 

Centro de Documentacion Regional "Juan Bautista Vázquez"

Biblioteca Campus Central Biblioteca Campus Salud Biblioteca Campus Yanuncay
Av. 12 de Abril y Calle Agustín Cueva, Telf: 4051000 Ext. 1311, 1312, 1313, 1314. Horario de atención: Lunes-Viernes: 07H00-21H00. Sábados: 08H00-12H00 Av. El Paraíso 3-52, detrás del Hospital Regional "Vicente Corral Moscoso", Telf: 4051000 Ext. 3144. Horario de atención: Lunes-Viernes: 07H00-19H00 Av. 12 de Octubre y Diego de Tapia, antiguo Colegio Orientalista, Telf: 4051000 Ext. 3535 2810706 Ext. 116. Horario de atención: Lunes-Viernes: 07H30-19H00