改进型加权KNN算法的不平衡数据集分类
发布时间:2024-08-09
点击次数:
- 所属单位:
- 信息与控制工程学院
- 发表刊物:
- 计算机工程
- 关键字:
- 中文关键字:不平衡数据集;分类;KNN;权重分配模型;遗传算法;K-means算法,英文关键字:imbalanced dataset; classification; KNN; weight as
- 摘要:
- 针对KNN(K-Nearest Neighbor)算法对不平衡数据集进行分类时的不足,提出了一种新颖的基于权重的KNN算法(简称GAK-KNN)。算法的关键在于定义了一种新的权重分配模型,该模型综合考虑了类间分布不平衡以及类内分布不均匀的不良影响。算法的基本步骤如下:首先采用基于遗传算法的K-means算法对训练样本集进行聚类,然后对聚类结果依照本文提出的权重分配模型计算各个训练样本的权重,最后采用改进的KNN算法对测试样本进行分类。通过对UCI数据集的大量实验表明,GAK-KNN在少数类样本的识别率和分类器的整体性能上都要优于传统KNN算法以及其它改进方法。
- 备注:
- 王超学
- 合写作者:
- 潘正茂,马春森
- 第一作者:
- 张涛[重名-待确认],董丽丽,王超学
- 论文类型:
- 期刊论文
- 卷号:
- 卷:38
- 期号:
- 期:20
- 页面范围:
- 页:160-163
- 是否译文:
- 否
- 发表时间:
- 2012-10-01



