Affiliation of Author(s):
信息与控制工程学院
Key Words:
中文关键字:Bagging;C4.5;中文文本分类,英文关键字:Bagging; C4.5; Chinese text categorization
Abstract:
对于中文文本分类问题,提出一种新的Bagging方法。这一方法以决策树C4.5算法为弱分类器,通过实例重取样获取多个训练集,将其结果按照投票规则进行合成,最终得到分类结果。实验证明,这种算法的准确率、查全率、F1值比C4.5、kNN和朴素贝叶斯分类器都高,具有更加优良的性能。