Development of an Efficient Hierarchical Clustering Analysis using an Agglomerative Clustering Algorithm

Arshia Naeem; Mariam Rehman; Maria Anjum; Muhammad Asif

doi:10.18520/cs/v117/i6/1045-1053

Vol 117, No 6 (2019)
Pages: 1045-1053
Published: 2019-09-25
https://doi.org/10.18520/cs%2Fv117%2Fi6%2F1045-1053
Cited by 0 articles

Development of an Efficient Hierarchical Clustering Analysis using an Agglomerative Clustering Algorithm

Arshia Naeem ¹, Mariam Rehman ², Maria Anjum ¹, Muhammad Asif ³

Affiliations
1 Department of Computer Science, Lahore College for Women University, Lahore 54000, Pakistan
2 Department of Information Technology, Government College University Faisalabad 38000, Pakistan
3 Department of Computer Science, National Textile University, Faisalabad 37610, Pakistan

Clustering algorithms are used to generate clusters of elements having similar characteristics. Among the different groups of clustering algorithms, agglomerative algorithm is widely used in the document clustering domain. This study aimed to examine the effectiveness of agglomerative clustering algorithm in document clustering by enhancing its efficiency and evaluating it through implementation. The resulting values, precision = 0.8571, recall = 0.8571 and F-measure = 0.857076 indicate the highest level of accuracy and efficiency compared to existing algorithm.

Keywords

Cosine Similarity Measure, Document Clustering, F-Measure, Hierarchical Agglomerative Clustering, Preprocessing, TF-IDF.

I-Scholar

Journal Help

User

Notifications

Journal Content
Browse

Font Size

Information

Development of an Efficient Hierarchical Clustering Analysis using an Agglomerative Clustering Algorithm

Abstract Views: 553 | PDF Views: 149

Authors

Arshia Naeem
Department of Computer Science, Lahore College for Women University, Lahore 54000, Pakistan

Mariam Rehman
Department of Information Technology, Government College University Faisalabad 38000, Pakistan

Maria Anjum
Department of Computer Science, Lahore College for Women University, Lahore 54000, Pakistan

Muhammad Asif
Department of Computer Science, National Textile University, Faisalabad 37610, Pakistan

Abstract

Keywords

Cosine Similarity Measure, Document Clustering, F-Measure, Hierarchical Agglomerative Clustering, Preprocessing, TF-IDF.

References

DOI: https://doi.org/10.18520/cs%2Fv117%2Fi6%2F1045-1053

Username
Password
Remember me

Username
Password
Remember me

Current Science

Current Science

Development of an Efficient Hierarchical Clustering Analysis using an Agglomerative Clustering Algorithm

Keywords

Development of an Efficient Hierarchical Clustering Analysis using an Agglomerative Clustering Algorithm

Authors

Abstract

Keywords

References