Abstract
En este trabajo de investigación se presenta una herramienta bioinformática que permite clasificar automáticamente artículos científicos referentes a estudios epidemiológicos de tipo caso-control concernientes a Polimorfismos de Nucleótidos Simples (SNPs), presentes en genes, y su asociación a distintos tipos de cáncer, y otras enfermedades genéticas de interés para el experto mediante la utilización de técnicas de minería de texto (MT), así también como la implementación del meta-estimador Bagging para tres técnicas de clasificación: Support Vector Machine (SVM), K-Nearest Neighbors (KNN), y Naives Bayes (NB). La clasificación se realiza a partir de los metadatos de dichos artículos, los cuales están disponibles en el National Center for Biotechnology Information (NCBI).