结合样本局部密度的非平衡数据集成分类算法
TP391; 传统的过采样方法是解决非平衡数据分类问题的有效方法之一.基于SMOTE的过采样方法在数据集出现类别重叠(class-overlapping)和小析取项(small-disjuncts)问题时将降低采样的效果,针对该问题提出了一种基于样本局部密度的过采样算法MOLAD.在此基础上,为了解决非平衡数据的分类问题,提出了一种在采样阶段将MOLAD算法和基于Bagging的集成学习结合的算法LADBMOTE.LADBMOTE首先根据MOLAD计算每个少数类样本的K近邻,然后选择所有的K近邻进行采样,生成K个平衡数据集,最后利用基于Bagging的集成学习方法将K个平衡数据集训练得到的分类...
Saved in:
| Published in | 计算机科学与探索 Vol. 14; no. 2; pp. 274 - 284 |
|---|---|
| Main Authors | , |
| Format | Journal Article |
| Language | Chinese |
| Published |
西南交通大学 信息科学与技术学院,成都,611756%西南交通大学 信息科学与技术学院,成都 611756
01.02.2020
云计算与智能技术高校重点实验室(西南交通大学),成都 611756 |
| Subjects | |
| Online Access | Get full text |
| ISSN | 1673-9418 |
| DOI | 10.3778/j.issn.1673-9418.1901017 |
Cover
| Abstract | TP391; 传统的过采样方法是解决非平衡数据分类问题的有效方法之一.基于SMOTE的过采样方法在数据集出现类别重叠(class-overlapping)和小析取项(small-disjuncts)问题时将降低采样的效果,针对该问题提出了一种基于样本局部密度的过采样算法MOLAD.在此基础上,为了解决非平衡数据的分类问题,提出了一种在采样阶段将MOLAD算法和基于Bagging的集成学习结合的算法LADBMOTE.LADBMOTE首先根据MOLAD计算每个少数类样本的K近邻,然后选择所有的K近邻进行采样,生成K个平衡数据集,最后利用基于Bagging的集成学习方法将K个平衡数据集训练得到的分类器集成.在KEEL公开的20个非平衡数据集上,将提出的LADBMOTE算法与当前流行的7个处理非平衡数据的算法对比,实验结果表明LADBMOTE在不同的分类器上的分类性能更好,鲁棒性更强. |
|---|---|
| AbstractList | TP391; 传统的过采样方法是解决非平衡数据分类问题的有效方法之一.基于SMOTE的过采样方法在数据集出现类别重叠(class-overlapping)和小析取项(small-disjuncts)问题时将降低采样的效果,针对该问题提出了一种基于样本局部密度的过采样算法MOLAD.在此基础上,为了解决非平衡数据的分类问题,提出了一种在采样阶段将MOLAD算法和基于Bagging的集成学习结合的算法LADBMOTE.LADBMOTE首先根据MOLAD计算每个少数类样本的K近邻,然后选择所有的K近邻进行采样,生成K个平衡数据集,最后利用基于Bagging的集成学习方法将K个平衡数据集训练得到的分类器集成.在KEEL公开的20个非平衡数据集上,将提出的LADBMOTE算法与当前流行的7个处理非平衡数据的算法对比,实验结果表明LADBMOTE在不同的分类器上的分类性能更好,鲁棒性更强. |
| Author | 陈红梅 杨浩 |
| AuthorAffiliation | 西南交通大学 信息科学与技术学院,成都,611756%西南交通大学 信息科学与技术学院,成都 611756;云计算与智能技术高校重点实验室(西南交通大学),成都 611756 |
| AuthorAffiliation_xml | – name: 西南交通大学 信息科学与技术学院,成都,611756%西南交通大学 信息科学与技术学院,成都 611756;云计算与智能技术高校重点实验室(西南交通大学),成都 611756 |
| Author_FL | YANG Hao CHEN Hongmei |
| Author_FL_xml | – sequence: 1 fullname: YANG Hao – sequence: 2 fullname: CHEN Hongmei |
| Author_xml | – sequence: 1 fullname: 杨浩 – sequence: 2 fullname: 陈红梅 |
| BookMark | eNrjYmDJy89LZWBQMDTQMzY3t9DP0sssLs7TMzQzN9a1NDG00DO0NDA0MDRnYeCEi3Ew8BYXZyYZmJqYGBmam1lwMtg83z356YSOZwu2P5uz5unGhpfNK56ub3u6a9nzWS0v5857unPzi4ULn03d8Kx33cvZbc86JjztaHu-cffzddOfbZ7Kw8CalphTnMoLpbkZQt1cQ5w9dH383T2dHX10iw0NTCx0LVMTLQwNLVOT0pKMDE0tDUzMU03SjJPMDM1MTJKSDdOMLC0TTZINzZKNLJMMTS2SE41TE1NMk01NTc3MkoDSxtwMmhBzyxPz0hLz0uOz8kuL8oA2xmcVZ2VXVJYUGxkYGYCQhTEA331jqw |
| ClassificationCodes | TP391 |
| ContentType | Journal Article |
| Copyright | Copyright © Wanfang Data Co. Ltd. All Rights Reserved. |
| Copyright_xml | – notice: Copyright © Wanfang Data Co. Ltd. All Rights Reserved. |
| DBID | 2B. 4A8 92I 93N PSX TCJ |
| DOI | 10.3778/j.issn.1673-9418.1901017 |
| DatabaseName | Wanfang Data Journals - Hong Kong WANFANG Data Centre Wanfang Data Journals 万方数据期刊 - 香港版 China Online Journals (COJ) China Online Journals (COJ) |
| DatabaseTitleList | |
| DeliveryMethod | fulltext_linktorsrc |
| DocumentTitle_FL | Ensemble Classification Algorithm for Imbalanced Data Combined with Local Area Density |
| EndPage | 284 |
| ExternalDocumentID | jsjkxyts202002008 |
| GrantInformation_xml | – fundername: The National Natural Science Foundation of China under Grant No. 61572406 |
| GroupedDBID | 2B. 4A8 92I 93N ALMA_UNASSIGNED_HOLDINGS M~E PSX TCJ |
| ID | FETCH-LOGICAL-s1048-9ea8119ebfb2159047e4f3b61644bc1f299a4c16c29b158ca3ead5c55566b1f23 |
| ISSN | 1673-9418 |
| IngestDate | Thu May 29 04:00:17 EDT 2025 |
| IsPeerReviewed | true |
| IsScholarly | true |
| Issue | 2 |
| Keywords | 集成学习 过采样 近邻计算策略 非平衡数据 |
| Language | Chinese |
| LinkModel | OpenURL |
| MergedId | FETCHMERGED-LOGICAL-s1048-9ea8119ebfb2159047e4f3b61644bc1f299a4c16c29b158ca3ead5c55566b1f23 |
| PageCount | 11 |
| ParticipantIDs | wanfang_journals_jsjkxyts202002008 |
| PublicationCentury | 2000 |
| PublicationDate | 2020-02-01 |
| PublicationDateYYYYMMDD | 2020-02-01 |
| PublicationDate_xml | – month: 02 year: 2020 text: 2020-02-01 day: 01 |
| PublicationDecade | 2020 |
| PublicationTitle | 计算机科学与探索 |
| PublicationTitle_FL | Journal of Frontiers of Computer Science & Technology |
| PublicationYear | 2020 |
| Publisher | 西南交通大学 信息科学与技术学院,成都,611756%西南交通大学 信息科学与技术学院,成都 611756 云计算与智能技术高校重点实验室(西南交通大学),成都 611756 |
| Publisher_xml | – name: 西南交通大学 信息科学与技术学院,成都,611756%西南交通大学 信息科学与技术学院,成都 611756 – name: 云计算与智能技术高校重点实验室(西南交通大学),成都 611756 |
| SSID | ssib054421768 ssib002040941 ssib002423894 ssib051375751 ssib023646573 ssib036438069 ssib002040926 |
| Score | 2.2215862 |
| Snippet | TP391; 传统的过采样方法是解决非平衡数据分类问题的有效方法之一.基于SMOTE的过采样方法在数据集出现类别重叠(class-overlapping)和小析取项(small-disjuncts)问题时将降... |
| SourceID | wanfang |
| SourceType | Aggregation Database |
| StartPage | 274 |
| Title | 结合样本局部密度的非平衡数据集成分类算法 |
| URI | https://d.wanfangdata.com.cn/periodical/jsjkxyts202002008 |
| Volume | 14 |
| hasFullText | 1 |
| inHoldings | 1 |
| isFullTextHit | |
| isPrint | |
| journalDatabaseRights | – providerCode: PRVHPJ databaseName: ROAD: Directory of Open Access Scholarly Resources issn: 1673-9418 databaseCode: M~E dateStart: 20070101 customDbUrl: isFulltext: true dateEnd: 99991231 titleUrlDefault: https://road.issn.org omitProxy: true ssIdentifier: ssib054421768 providerName: ISSN International Centre |
| link | http://utb.summon.serialssolutions.com/2.0.0/link/0/eLvHCXMwzV3Na9RAFA-1XryIouJnKeKcSmomM5nMgJdkN0sR6qmF3kqSJkqFFdwtaA8iKGUvQkGK4Bf2Ih6kWnoQ7d-zu-5_4Xsv2d20KlZPQgiTmTdvfm_e7rz3dudlLOsazzIT54ljS50LWwqpbZ25whaxrxNwSHzpYTby_C01tyhvLnlLE5NTlV1La-1kNl3_ZV7Jv2gV6kCvmCX7F5odMYUKKIN-4Q4ahvuRdMwin4UhM4JFHjMO05pFigUOC30smBoLatgUctzQEBmmBQs01gQNphU1BSxQyMcETEukMXVmImoyLATOmgUcL2QIlQ4WdJ0FERGHxEfh0AAAekFBE0MYFLBBASgN4QFuxVGXQ2-YmEfEvEIGsAEV1gAqTmjrBFKyEJhHNBz0cmkUCYXhp4Z610lEGA36mXELYDU0QT7J7NJMuaw4yWf4uwcEuc6BPSSEEKRukGh1QiiJAc0VbhMJCKFEtEOoM0TUKGdNc5zuP8gTkIYKnTUqNAQbcLq1yiyTIsM6VCp8B6pirvdfA50pYFYMoPKFbWRpE4cWUlZWArdq7ooTlkrPyS0O-ztslIXvazLKOMDsaIBZdEWdInH30CvPV1urdx88bLdQ7XjpY9ZxF6w2Hs0y_ygau5dggUw1PMZneSBPG_zxkb3BsxKUN3bX4VFoR43ceY8LH_-GHD1LCQF7kU07RF1sBkSRrv9OIEr_a-Zx83bFU104ZZ0sQ8zpoFgvTlsT63fOWDf6-8-7m53euy-91x-7u48HTz50P210v73vv3w6ePO2-3Xv-_Z2b-tz79nO4NVGr7PZ7Wz0d_f7Oy96e1tnrcVGtFCbs8uTU-wWB5NsmyzWnJssyRNw6Y0j_UzmIlEcop8k5Tn4oLFMuUpdk3BPp7EAg-KlngfBXQLN4pw12bzXzM5b03KFKw-IhVCpNP6KMbkLMRyX2okT1zEXrKultMvlytha_kl_F49CdMk6Mf6eX7Ym2_fXsivg8beTKVL7D1TKtYk |
| linkProvider | ISSN International Centre |
| openUrl | ctx_ver=Z39.88-2004&ctx_enc=info%3Aofi%2Fenc%3AUTF-8&rfr_id=info%3Asid%2Fsummon.serialssolutions.com&rft_val_fmt=info%3Aofi%2Ffmt%3Akev%3Amtx%3Ajournal&rft.genre=article&rft.atitle=%E7%BB%93%E5%90%88%E6%A0%B7%E6%9C%AC%E5%B1%80%E9%83%A8%E5%AF%86%E5%BA%A6%E7%9A%84%E9%9D%9E%E5%B9%B3%E8%A1%A1%E6%95%B0%E6%8D%AE%E9%9B%86%E6%88%90%E5%88%86%E7%B1%BB%E7%AE%97%E6%B3%95&rft.jtitle=%E8%AE%A1%E7%AE%97%E6%9C%BA%E7%A7%91%E5%AD%A6%E4%B8%8E%E6%8E%A2%E7%B4%A2&rft.au=%E6%9D%A8%E6%B5%A9&rft.au=%E9%99%88%E7%BA%A2%E6%A2%85&rft.date=2020-02-01&rft.pub=%E8%A5%BF%E5%8D%97%E4%BA%A4%E9%80%9A%E5%A4%A7%E5%AD%A6+%E4%BF%A1%E6%81%AF%E7%A7%91%E5%AD%A6%E4%B8%8E%E6%8A%80%E6%9C%AF%E5%AD%A6%E9%99%A2%2C%E6%88%90%E9%83%BD%2C611756%25%E8%A5%BF%E5%8D%97%E4%BA%A4%E9%80%9A%E5%A4%A7%E5%AD%A6+%E4%BF%A1%E6%81%AF%E7%A7%91%E5%AD%A6%E4%B8%8E%E6%8A%80%E6%9C%AF%E5%AD%A6%E9%99%A2%2C%E6%88%90%E9%83%BD+611756&rft.issn=1673-9418&rft.volume=14&rft.issue=2&rft.spage=274&rft.epage=284&rft_id=info:doi/10.3778%2Fj.issn.1673-9418.1901017&rft.externalDocID=jsjkxyts202002008 |
| thumbnail_s | http://utb.summon.serialssolutions.com/2.0.0/image/custom?url=http%3A%2F%2Fwww.wanfangdata.com.cn%2Fimages%2FPeriodicalImages%2Fjsjkxyts%2Fjsjkxyts.jpg |