Paper Publications

改进型加权KNN算法的不平衡数据集分类

Release time:2024-08-09
Hits:
Affiliation of Author(s):
信息与控制工程学院
Journal:
计算机工程
Key Words:
中文关键字:不平衡数据集;分类;KNN;权重分配模型;遗传算法;K-means算法,英文关键字:imbalanced dataset; classification; KNN; weight as
Abstract:
针对KNN(K-Nearest Neighbor)算法对不平衡数据集进行分类时的不足,提出了一种新颖的基于权重的KNN算法(简称GAK-KNN)。算法的关键在于定义了一种新的权重分配模型,该模型综合考虑了类间分布不平衡以及类内分布不均匀的不良影响。算法的基本步骤如下:首先采用基于遗传算法的K-means算法对训练样本集进行聚类,然后对聚类结果依照本文提出的权重分配模型计算各个训练样本的权重,最后采用改进的KNN算法对测试样本进行分类。通过对UCI数据集的大量实验表明,GAK-KNN在少数类样本的识别率和分类器的整体性能上都要优于传统KNN算法以及其它改进方法。
Note:
王超学
Co-author:
潘正茂,马春森
First Author:
张涛[重名-待确认],董丽丽,wangchaoxue
Indexed by:
Journal paper
Volume:
卷:38
Issue:
期:20
Page Number:
页:160-163
Translation or Not:
no
Date of Publication:
2012-10-01