【作者】 古恒; 陈钊; 王枞; 张思悦; 傅群超;
【Author】 GU Heng;CHEN Zhao;WANG Cong;ZHANG Si-yue;FU Qun-chao;School of Computer Science,Beijing University of Posts and Telecommunications;Key Laboratory of Trustworthy Distributed Computing and Service ( BUPT) ,Ministry of Education,Beijing University of Posts and Telecommunications;Beijing Government Computer Emergency Response Center;School of Software,Beijing University of Posts and Telecommunications;
【机构】 北京邮电大学计算机学院; 北京邮电大学可信分布式计算与服务教育部重点实验室; 北京市政务信息安全应急处置中心; 北京邮电大学软件学院;
【摘要】 提出了一种基于自组织特征映射(SOM)神经网络和模糊c-均值(FCM)的双层聚类方法,对Web日志中的日志数据集进行聚类.第一层是无监督SOM神经网络聚类方法,它所产生的类的个数大大减少了原始数据集的个数,降低了FCM对类初始中心点的依赖;然后利用FCM聚类算法的优势对第一层中产生的类的中心点进行聚类,从而大大减少了聚类的时间复杂度;最后通过平行坐标技术可视化展示聚类前后的日志数据集,方便对日志数据进行分析.