结合样本局部密度的非平衡数据集成分类算法

TP391; 传统的过采样方法是解决非平衡数据分类问题的有效方法之一.基于SMOTE的过采样方法在数据集出现类别重叠(class-overlapping)和小析取项(small-disjuncts)问题时将降低采样的效果,针对该问题提出了一种基于样本局部密度的过采样算法MOLAD.在此基础上,为了解决非平衡数据的分类问题,提出了一种在采样阶段将MOLAD算法和基于Bagging的集成学习结合的算法LADBMOTE.LADBMOTE首先根据MOLAD计算每个少数类样本的K近邻,然后选择所有的K近邻进行采样,生成K个平衡数据集,最后利用基于Bagging的集成学习方法将K个平衡数据集训练得到的分类...

Full description

Saved in:
Bibliographic Details
Published in计算机科学与探索 Vol. 14; no. 2; pp. 274 - 284
Main Authors 杨浩, 陈红梅
Format Journal Article
LanguageChinese
Published 西南交通大学 信息科学与技术学院,成都,611756%西南交通大学 信息科学与技术学院,成都 611756 01.02.2020
云计算与智能技术高校重点实验室(西南交通大学),成都 611756
Subjects
Online AccessGet full text
ISSN1673-9418
DOI10.3778/j.issn.1673-9418.1901017

Cover

Abstract TP391; 传统的过采样方法是解决非平衡数据分类问题的有效方法之一.基于SMOTE的过采样方法在数据集出现类别重叠(class-overlapping)和小析取项(small-disjuncts)问题时将降低采样的效果,针对该问题提出了一种基于样本局部密度的过采样算法MOLAD.在此基础上,为了解决非平衡数据的分类问题,提出了一种在采样阶段将MOLAD算法和基于Bagging的集成学习结合的算法LADBMOTE.LADBMOTE首先根据MOLAD计算每个少数类样本的K近邻,然后选择所有的K近邻进行采样,生成K个平衡数据集,最后利用基于Bagging的集成学习方法将K个平衡数据集训练得到的分类器集成.在KEEL公开的20个非平衡数据集上,将提出的LADBMOTE算法与当前流行的7个处理非平衡数据的算法对比,实验结果表明LADBMOTE在不同的分类器上的分类性能更好,鲁棒性更强.
AbstractList TP391; 传统的过采样方法是解决非平衡数据分类问题的有效方法之一.基于SMOTE的过采样方法在数据集出现类别重叠(class-overlapping)和小析取项(small-disjuncts)问题时将降低采样的效果,针对该问题提出了一种基于样本局部密度的过采样算法MOLAD.在此基础上,为了解决非平衡数据的分类问题,提出了一种在采样阶段将MOLAD算法和基于Bagging的集成学习结合的算法LADBMOTE.LADBMOTE首先根据MOLAD计算每个少数类样本的K近邻,然后选择所有的K近邻进行采样,生成K个平衡数据集,最后利用基于Bagging的集成学习方法将K个平衡数据集训练得到的分类器集成.在KEEL公开的20个非平衡数据集上,将提出的LADBMOTE算法与当前流行的7个处理非平衡数据的算法对比,实验结果表明LADBMOTE在不同的分类器上的分类性能更好,鲁棒性更强.
Author 陈红梅
杨浩
AuthorAffiliation 西南交通大学 信息科学与技术学院,成都,611756%西南交通大学 信息科学与技术学院,成都 611756;云计算与智能技术高校重点实验室(西南交通大学),成都 611756
AuthorAffiliation_xml – name: 西南交通大学 信息科学与技术学院,成都,611756%西南交通大学 信息科学与技术学院,成都 611756;云计算与智能技术高校重点实验室(西南交通大学),成都 611756
Author_FL YANG Hao
CHEN Hongmei
Author_FL_xml – sequence: 1
  fullname: YANG Hao
– sequence: 2
  fullname: CHEN Hongmei
Author_xml – sequence: 1
  fullname: 杨浩
– sequence: 2
  fullname: 陈红梅
BookMark eNrjYmDJy89LZWBQMDTQMzY3t9DP0sssLs7TMzQzN9a1NDG00DO0NDA0MDRnYeCEi3Ew8BYXZyYZmJqYGBmam1lwMtg83z356YSOZwu2P5uz5unGhpfNK56ub3u6a9nzWS0v5857unPzi4ULn03d8Kx33cvZbc86JjztaHu-cffzddOfbZ7Kw8CalphTnMoLpbkZQt1cQ5w9dH383T2dHX10iw0NTCx0LVMTLQwNLVOT0pKMDE0tDUzMU03SjJPMDM1MTJKSDdOMLC0TTZINzZKNLJMMTS2SE41TE1NMk01NTc3MkoDSxtwMmhBzyxPz0hLz0uOz8kuL8oA2xmcVZ2VXVJYUGxkYGYCQhTEA331jqw
ClassificationCodes TP391
ContentType Journal Article
Copyright Copyright © Wanfang Data Co. Ltd. All Rights Reserved.
Copyright_xml – notice: Copyright © Wanfang Data Co. Ltd. All Rights Reserved.
DBID 2B.
4A8
92I
93N
PSX
TCJ
DOI 10.3778/j.issn.1673-9418.1901017
DatabaseName Wanfang Data Journals - Hong Kong
WANFANG Data Centre
Wanfang Data Journals
万方数据期刊 - 香港版
China Online Journals (COJ)
China Online Journals (COJ)
DatabaseTitleList
DeliveryMethod fulltext_linktorsrc
DocumentTitle_FL Ensemble Classification Algorithm for Imbalanced Data Combined with Local Area Density
EndPage 284
ExternalDocumentID jsjkxyts202002008
GrantInformation_xml – fundername: The National Natural Science Foundation of China under Grant No. 61572406
GroupedDBID 2B.
4A8
92I
93N
ALMA_UNASSIGNED_HOLDINGS
M~E
PSX
TCJ
ID FETCH-LOGICAL-s1048-9ea8119ebfb2159047e4f3b61644bc1f299a4c16c29b158ca3ead5c55566b1f23
ISSN 1673-9418
IngestDate Thu May 29 04:00:17 EDT 2025
IsPeerReviewed true
IsScholarly true
Issue 2
Keywords 集成学习
过采样
近邻计算策略
非平衡数据
Language Chinese
LinkModel OpenURL
MergedId FETCHMERGED-LOGICAL-s1048-9ea8119ebfb2159047e4f3b61644bc1f299a4c16c29b158ca3ead5c55566b1f23
PageCount 11
ParticipantIDs wanfang_journals_jsjkxyts202002008
PublicationCentury 2000
PublicationDate 2020-02-01
PublicationDateYYYYMMDD 2020-02-01
PublicationDate_xml – month: 02
  year: 2020
  text: 2020-02-01
  day: 01
PublicationDecade 2020
PublicationTitle 计算机科学与探索
PublicationTitle_FL Journal of Frontiers of Computer Science & Technology
PublicationYear 2020
Publisher 西南交通大学 信息科学与技术学院,成都,611756%西南交通大学 信息科学与技术学院,成都 611756
云计算与智能技术高校重点实验室(西南交通大学),成都 611756
Publisher_xml – name: 西南交通大学 信息科学与技术学院,成都,611756%西南交通大学 信息科学与技术学院,成都 611756
– name: 云计算与智能技术高校重点实验室(西南交通大学),成都 611756
SSID ssib054421768
ssib002040941
ssib002423894
ssib051375751
ssib023646573
ssib036438069
ssib002040926
Score 2.2215862
Snippet TP391; 传统的过采样方法是解决非平衡数据分类问题的有效方法之一.基于SMOTE的过采样方法在数据集出现类别重叠(class-overlapping)和小析取项(small-disjuncts)问题时将降...
SourceID wanfang
SourceType Aggregation Database
StartPage 274
Title 结合样本局部密度的非平衡数据集成分类算法
URI https://d.wanfangdata.com.cn/periodical/jsjkxyts202002008
Volume 14
hasFullText 1
inHoldings 1
isFullTextHit
isPrint
journalDatabaseRights – providerCode: PRVHPJ
  databaseName: ROAD: Directory of Open Access Scholarly Resources
  issn: 1673-9418
  databaseCode: M~E
  dateStart: 20070101
  customDbUrl:
  isFulltext: true
  dateEnd: 99991231
  titleUrlDefault: https://road.issn.org
  omitProxy: true
  ssIdentifier: ssib054421768
  providerName: ISSN International Centre
link http://utb.summon.serialssolutions.com/2.0.0/link/0/eLvHCXMwzV3Na9RAFA-1XryIouJnKeKcSmomM5nMgJdkN0sR6qmF3kqSJkqFFdwtaA8iKGUvQkGK4Bf2Ih6kWnoQ7d-zu-5_4Xsv2d20KlZPQgiTmTdvfm_e7rz3dudlLOsazzIT54ljS50LWwqpbZ25whaxrxNwSHzpYTby_C01tyhvLnlLE5NTlV1La-1kNl3_ZV7Jv2gV6kCvmCX7F5odMYUKKIN-4Q4ahvuRdMwin4UhM4JFHjMO05pFigUOC30smBoLatgUctzQEBmmBQs01gQNphU1BSxQyMcETEukMXVmImoyLATOmgUcL2QIlQ4WdJ0FERGHxEfh0AAAekFBE0MYFLBBASgN4QFuxVGXQ2-YmEfEvEIGsAEV1gAqTmjrBFKyEJhHNBz0cmkUCYXhp4Z610lEGA36mXELYDU0QT7J7NJMuaw4yWf4uwcEuc6BPSSEEKRukGh1QiiJAc0VbhMJCKFEtEOoM0TUKGdNc5zuP8gTkIYKnTUqNAQbcLq1yiyTIsM6VCp8B6pirvdfA50pYFYMoPKFbWRpE4cWUlZWArdq7ooTlkrPyS0O-ztslIXvazLKOMDsaIBZdEWdInH30CvPV1urdx88bLdQ7XjpY9ZxF6w2Hs0y_ygau5dggUw1PMZneSBPG_zxkb3BsxKUN3bX4VFoR43ceY8LH_-GHD1LCQF7kU07RF1sBkSRrv9OIEr_a-Zx83bFU104ZZ0sQ8zpoFgvTlsT63fOWDf6-8-7m53euy-91x-7u48HTz50P210v73vv3w6ePO2-3Xv-_Z2b-tz79nO4NVGr7PZ7Wz0d_f7Oy96e1tnrcVGtFCbs8uTU-wWB5NsmyzWnJssyRNw6Y0j_UzmIlEcop8k5Tn4oLFMuUpdk3BPp7EAg-KlngfBXQLN4pw12bzXzM5b03KFKw-IhVCpNP6KMbkLMRyX2okT1zEXrKultMvlytha_kl_F49CdMk6Mf6eX7Ym2_fXsivg8beTKVL7D1TKtYk
linkProvider ISSN International Centre
openUrl ctx_ver=Z39.88-2004&ctx_enc=info%3Aofi%2Fenc%3AUTF-8&rfr_id=info%3Asid%2Fsummon.serialssolutions.com&rft_val_fmt=info%3Aofi%2Ffmt%3Akev%3Amtx%3Ajournal&rft.genre=article&rft.atitle=%E7%BB%93%E5%90%88%E6%A0%B7%E6%9C%AC%E5%B1%80%E9%83%A8%E5%AF%86%E5%BA%A6%E7%9A%84%E9%9D%9E%E5%B9%B3%E8%A1%A1%E6%95%B0%E6%8D%AE%E9%9B%86%E6%88%90%E5%88%86%E7%B1%BB%E7%AE%97%E6%B3%95&rft.jtitle=%E8%AE%A1%E7%AE%97%E6%9C%BA%E7%A7%91%E5%AD%A6%E4%B8%8E%E6%8E%A2%E7%B4%A2&rft.au=%E6%9D%A8%E6%B5%A9&rft.au=%E9%99%88%E7%BA%A2%E6%A2%85&rft.date=2020-02-01&rft.pub=%E8%A5%BF%E5%8D%97%E4%BA%A4%E9%80%9A%E5%A4%A7%E5%AD%A6+%E4%BF%A1%E6%81%AF%E7%A7%91%E5%AD%A6%E4%B8%8E%E6%8A%80%E6%9C%AF%E5%AD%A6%E9%99%A2%2C%E6%88%90%E9%83%BD%2C611756%25%E8%A5%BF%E5%8D%97%E4%BA%A4%E9%80%9A%E5%A4%A7%E5%AD%A6+%E4%BF%A1%E6%81%AF%E7%A7%91%E5%AD%A6%E4%B8%8E%E6%8A%80%E6%9C%AF%E5%AD%A6%E9%99%A2%2C%E6%88%90%E9%83%BD+611756&rft.issn=1673-9418&rft.volume=14&rft.issue=2&rft.spage=274&rft.epage=284&rft_id=info:doi/10.3778%2Fj.issn.1673-9418.1901017&rft.externalDocID=jsjkxyts202002008
thumbnail_s http://utb.summon.serialssolutions.com/2.0.0/image/custom?url=http%3A%2F%2Fwww.wanfangdata.com.cn%2Fimages%2FPeriodicalImages%2Fjsjkxyts%2Fjsjkxyts.jpg