基于概率阈值Bagging算法的不平衡数据分类方法

TP311; 类别不平衡问题广泛存在于现实生活中,多数传统分类器假定类分布平衡或误分类代价相等,因此类别不平衡数据严重影响了传统分类器的分类性能.针对不平衡数据集的分类问题,提出了一种处理不平衡数据的概率阈值Bagging分类方法—PT-Bagging.将阈值移动技术与Bagging集成算法结合起来,在训练阶段使用原始分布的训练集进行训练,在预测阶段引入决策阈值移动方法,利用校准的后验概率估计得到对不平衡数据分类的最大化性能测量.实验结果表明,PT-Bagging算法具有更好的处理不平衡数据的分类优势....

Full description

Saved in:
Bibliographic Details
Published in计算机工程与科学 Vol. 41; no. 6; pp. 1086 - 1094
Main Authors 张忠林, 吴挡平
Format Journal Article
LanguageChinese
Published 兰州交通大学电子与信息工程学院,甘肃 兰州,730070 2019
Subjects
Online AccessGet full text
ISSN1007-130X
DOI10.3969/j.issn.1007-130X.2019.06.018

Cover

More Information
Summary:TP311; 类别不平衡问题广泛存在于现实生活中,多数传统分类器假定类分布平衡或误分类代价相等,因此类别不平衡数据严重影响了传统分类器的分类性能.针对不平衡数据集的分类问题,提出了一种处理不平衡数据的概率阈值Bagging分类方法—PT-Bagging.将阈值移动技术与Bagging集成算法结合起来,在训练阶段使用原始分布的训练集进行训练,在预测阶段引入决策阈值移动方法,利用校准的后验概率估计得到对不平衡数据分类的最大化性能测量.实验结果表明,PT-Bagging算法具有更好的处理不平衡数据的分类优势.
ISSN:1007-130X
DOI:10.3969/j.issn.1007-130X.2019.06.018