多类不平衡数据分类方法综述

TP3; 现实中许多领域产生的数据通常具有多个类别并且是不平衡的.在多类不平衡分类中,类重叠、噪声和多个少数类等问题降低了分类器的能力,而有效解决多类不平衡问题已经成为机器学习与数据挖掘领域中重要的研究课题.根据近年来的多类不平衡分类方法的文献,从数据预处理和算法级分类方法两方面进行了分析与总结,并从优缺点和数据集等方面对所有算法进行了详细分析.在数据预处理方法中,介绍了过采样、欠采样、混合采样和特征选择方法,对使用相同数据集算法的性能进行了比较.从基分类器优化、集成学习和多类分解技术三个方面对算法级分类方法展开介绍和分析.最后对多类不平衡数据分类研究领域的未来发展方向进行总结归纳....

Full description

Saved in:
Bibliographic Details
Published in计算机应用研究 Vol. 39; no. 12; pp. 3534 - 3545
Main Authors 李昂, 韩萌, 穆栋梁, 高智慧, 刘淑娟
Format Journal Article
LanguageChinese
Published 北方民族大学 计算机科学与工程学院,银川750021 2022
Subjects
Online AccessGet full text
ISSN1001-3695
DOI10.19734/j.issn.1001-3695.2022.03.0198

Cover

More Information
Summary:TP3; 现实中许多领域产生的数据通常具有多个类别并且是不平衡的.在多类不平衡分类中,类重叠、噪声和多个少数类等问题降低了分类器的能力,而有效解决多类不平衡问题已经成为机器学习与数据挖掘领域中重要的研究课题.根据近年来的多类不平衡分类方法的文献,从数据预处理和算法级分类方法两方面进行了分析与总结,并从优缺点和数据集等方面对所有算法进行了详细分析.在数据预处理方法中,介绍了过采样、欠采样、混合采样和特征选择方法,对使用相同数据集算法的性能进行了比较.从基分类器优化、集成学习和多类分解技术三个方面对算法级分类方法展开介绍和分析.最后对多类不平衡数据分类研究领域的未来发展方向进行总结归纳.
ISSN:1001-3695
DOI:10.19734/j.issn.1001-3695.2022.03.0198