基于概率阈值Bagging算法的不平衡数据分类方法
TP311; 类别不平衡问题广泛存在于现实生活中,多数传统分类器假定类分布平衡或误分类代价相等,因此类别不平衡数据严重影响了传统分类器的分类性能.针对不平衡数据集的分类问题,提出了一种处理不平衡数据的概率阈值Bagging分类方法—PT-Bagging.将阈值移动技术与Bagging集成算法结合起来,在训练阶段使用原始分布的训练集进行训练,在预测阶段引入决策阈值移动方法,利用校准的后验概率估计得到对不平衡数据分类的最大化性能测量.实验结果表明,PT-Bagging算法具有更好的处理不平衡数据的分类优势....
Saved in:
Published in | 计算机工程与科学 Vol. 41; no. 6; pp. 1086 - 1094 |
---|---|
Main Authors | , |
Format | Journal Article |
Language | Chinese |
Published |
兰州交通大学电子与信息工程学院,甘肃 兰州,730070
2019
|
Subjects | |
Online Access | Get full text |
ISSN | 1007-130X |
DOI | 10.3969/j.issn.1007-130X.2019.06.018 |
Cover
Summary: | TP311; 类别不平衡问题广泛存在于现实生活中,多数传统分类器假定类分布平衡或误分类代价相等,因此类别不平衡数据严重影响了传统分类器的分类性能.针对不平衡数据集的分类问题,提出了一种处理不平衡数据的概率阈值Bagging分类方法—PT-Bagging.将阈值移动技术与Bagging集成算法结合起来,在训练阶段使用原始分布的训练集进行训练,在预测阶段引入决策阈值移动方法,利用校准的后验概率估计得到对不平衡数据分类的最大化性能测量.实验结果表明,PT-Bagging算法具有更好的处理不平衡数据的分类优势. |
---|---|
ISSN: | 1007-130X |
DOI: | 10.3969/j.issn.1007-130X.2019.06.018 |