期刊简介
本刊是由中国航天科工集团公司主管, 由航天科工集团十七所主办。它是仿真技术领域的综合性科技期刊。98年起已列入国家科技部中国科...【详细查看】
过刊浏览
信息公告
- 15/01 中国航天科工信...
- 14/09航天工业机关服务...
- 14/10航天信息股份有限...
- 14/12湖南航天工业总公...
- 14/08中国航天科工集团...
- 14/07中国航天科工集团...
- 14/06 南京航天管理干...
时间序列下超大规模数据流聚类方法研究
【出 处】:《
计算机仿真
》
CSCD
2014年第31卷第4期 273-276页,共4页
【作 者】:
张翼飞
;
魏现辉
【摘 要】
研究超大规模数据流聚类效率优化问题.时间序列下的数据流中元素的访问是单次线性的,即数据元素只能按其流入顺序依次读取一次.传统的方法对时间序列数据流聚类时,只是在方向上按照时间序列数据流元素的顺序进行聚类,效率较低.提出了基于微簇距离加权和属性信息贡献度的时序数据流聚类算法.在该算法中,首先以时间滑块窗口为时间单位对数据流数据进行实时获取,在线阶段对其数据流信息进行微簇的实时生成,并根据微簇的更新和删除对微簇集合进行维护;然后在离线阶段对微簇样本数据集合,依据样本数据的属性信息贡献度及其与样本类别的距离加权,对微簇进行实时聚类.实验证明,改进算法具有较高的执行效率,较高的吞吐量,并有效的降低了内存负载.
相关热词搜索: 数据流 聚类 微簇 距离加权 属性信息贡献度 滑动窗口 Data flow Clustering Micro cluster Distance weighting Attribute information contribution degree Sliding window
上一篇:复杂银行网络仿真系统的研究与设计
下一篇:一种基于递推最小二乘的频域辨识的新算法