期刊简介
本刊是由中国航天科工集团公司主管, 由航天科工集团十七所主办。它是仿真技术领域的综合性科技期刊。98年起已列入国家科技部中国科...【详细查看】
过刊浏览
信息公告
- 17/11深圳航天工业技术...
- 17/11中国航天科工集团...
- 17/11中国航天建设集团...
- 17/11关于集团公司改制...
- 17/11关于中国航天科工...
- 17/11中国航天科工集团...
- 17/11中国航天科工集团...
基于聚类分析的不均衡数据标注技术研究
【出 处】:
【作 者】:赵俊杰 黄四牛 吴正午 王帅
【摘 要】分布不均衡的数据在通过传统聚类分析的方式进行标注时,聚类效果容易偏向于样本数多的类,从而造成标注出现误差的问题。针对此问题提出改进的含有均衡约束聚类算法的标注方法,对不均衡数据的聚类标注准确率实现了比较有效的提高,方法包含数据初始聚类、专家知识调整,数据均衡化处理,含均衡约束聚类等步骤。通过初始聚类对不均衡数据进行初始类标签分配,专家知识调整对部分数据错误标注进行标签调整修改,对数据进行均衡化处理得到均衡数据集,通过均衡约束聚类对均衡数据进行标签最终精确分配。经仿真验证表明,上述方法比较有效的提高了不均衡数据标注准确率。