Análisis de clústeres para la clasificación de datos económicos

Rómulo Alejandro Barba López, Humberto Stanley Guerrero Herrera, Janeth Doris Salazar González

Resumen


El artículo tuvo como objetivo aplicar la clasificación por clusters para agrupar los  datos reportados en relación con los volúmenes de ventas y exportación reportados para las empresas en el Catálogo Central de Datos de Ecuador. Se decidió para ello el empleo del Rapidminer para  poder recomendar la utilización de este paquete en posibles situaciones de clases. Se realizó  el agrupamiento por clústeres empleando el algoritmo de k-medias, para 2536 empresas en relación con los datos reportados por estas en cuanto a; ventas totales, ventas nacionales, total de exportaciones netas, total de empleados, total de empleados hombres y total de empleados mujeres. Los operadores empleados y presentes en Rapidminer hicieron factible: la fácil lectura del fichero, el empleo del algoritmo de k medias y la obtención de tablas de correlaciones entre las variables señaladas. La posibilidad de representación gráfica facilitó un análisis desde multiples perspectivas.

En relación con el aprendizaje de Rapidminer debe señalarse que este paquete presenta todo un conjunto de operadores que no son de fácil  utilización para personal no especializado en estadística y en minería de datos. No obstante si se enfoca el aprendizaje de este en relación con aspectos específicos, como se realizó para el agrupamiento en clústeres y el establecimiento de correlaciones, si pudiera analizarse su posible  aplicación en la docencia de las ciencias  administrativas. A le vez las posibilidades gráficas que ofrece esta herramienta son muy atractivas para la presentación de resultados.

Palabras clave


rapidminer, agrupamiento por clusters, k medias

Texto completo:

Ver PDF

Referencias


González Alonso, J. A., et al.González, Y. P. (2015). Análisis de las revistas latinoamericanas de acceso abierto. El caso ecuador. Revista Publicando, 2(2), 12-23.

Hartigan, J. A. (1972). Direct clustering of a data matrix. Journal of the american statistical association, 67(337), 123-129.

Hernandez, A. B. (2015). La detección del fraude contable utilizando técnicas de minería de datos. Revista Publicando, 2(5), 103-113.

INEC. (2015). Estadisticas. Estadisticas Agropecuarias. Retrieved Febrero, 2016, de http://www.ecuadorencifras.gob.ec/estadisticas-agropecuarias-2/

Jain, A. K. (2010). Data clustering: 50 years beyond k-means. Pattern Recognition Letters, 31(8), 651-666.

Jungermann, F. (2009). Information extraction with rapidminer. Paper presented at the Proceedings of the GSCL Symposium’Sprachtechnologie und eHumanities.

Kou, G., Peng, Y., et al.Wang, G. (2014). Evaluation of clustering algorithms for financial risk analysis using mcdm methods. Information Sciences, 275, 1-12.

Pazmiño Santacruz, M. R., et al.González Alonso, J. A. (2014). Análisis exploratorio sobre las publicaciones relacionadas con la comunicación organizacional en pymes. Revista Publicando, 1(1).

Punj, G., et al.Stewart, D. W. (1983). Cluster analysis in marketing research: Review and suggestions for application. Journal of marketing research, 134-148.

Sánchez, Á. C. (2000). Aportaciones de la matemática a la metodología económica. Psicothema, 12(2), 103-107.

Sharma, A., et al.Lambert, D. M. (2013). Segmentation of markets based on customer service. International Journal of Physical Distribution & Logistics Management.


Enlaces refback

  • No hay ningún enlace refback.




Licencia de Creative Commons
Este obra está bajo una licencia de Creative Commons Reconocimiento-NoComercial-SinObraDerivada 4.0 Internacional.

Revista Publicando.

Licencia de Creative Commons

 

Esta obra está bajo una licencia de Creative Commons Reconocimiento-NoComercial-CompartirIgual 4.0 Internacional.