Paper Publications

基于改进SMOTE的非平衡数据集分类研究

Release time:2024-08-09
Hits:
Affiliation of Author(s):
信息与控制工程学院
Journal:
计算机工程与应用(CSCD核心版)
Key Words:
中文关键字:非平衡数据集;分类;支持度;轮盘赌选择;SMOTE,英文关键字:imbalanced datasets; classification; support; roul
Abstract:
针对SMOTE(Synthetic Minority Over-sampling Technique)在合成少数类新样本时存在的不足,提出 了一种改进的SMOTE算法(简称:SSMOTE)。该算法的关键是将支持度概念和轮盘赌选择技术引入到SMOTE 中,并充分利用了异类近邻的分布信息,实现了对少数类样本合成质量和数量的精细控制。本文将SSMOTE 与KNN(K-Nearest Neighbor)算法结合来处理不平衡数据集的分类问题。通过在UCI数据集上与其他重要文 献中的相关算法进行的大量对比实验表明,SSMOTE在新样本的整体合成效果上表现出色,有效提高了KNN 在非平衡数据集上的分类性能。
Note:
王超学
Co-author:
潘正茂,马春森
First Author:
张星,董丽丽,wangchaoxue
Indexed by:
Journal paper
Volume:
卷:48
Issue:
期:35
Page Number:
页:
Translation or Not:
no
Date of Publication:
2012-12-01