基于特征选择的过抽样算法的研究
为了提高不平衡数据集分类中少数类的分类精度,提出了基于特征选择的过抽样算法。该算法考虑了不同的特征列对分类性能的不同作用,首先对训练集进行特征选择,选出一组特征列,然后根据选出的特征列合成少数类样本,合成的每个少数类样本的特征由两部分组成,一部分是特征选择的特征列对应的特征,另一部分是按照SMOTE原理合成的特征。将基于特征选择的过抽样算法和SMOTE算法进行实验比较,结果表明基于特征选择的过抽样算法的性能优于SMOTE算法.能有效降低数据的不平衡性,提高少数类的分类精度。...
Saved in:
Published in | 电信科学 Vol. 28; no. 1; pp. 87 - 91 |
---|---|
Main Author | |
Format | Journal Article |
Language | Chinese |
Published |
中国通信学会
2012
人民邮电出版社有限公司 中国计量学院信息工程学院 杭州310018%中国计量学院信息工程学院 杭州310018%中国矿业大学信息与电气工程学院 徐州221008 中国矿业大学信息与电气工程学院 徐州221008 |
Subjects | |
Online Access | Get full text |
ISSN | 1000-0801 |
DOI | 10.3969/j.issn.1000-0801.2012.01.017 |
Cover
Abstract | 为了提高不平衡数据集分类中少数类的分类精度,提出了基于特征选择的过抽样算法。该算法考虑了不同的特征列对分类性能的不同作用,首先对训练集进行特征选择,选出一组特征列,然后根据选出的特征列合成少数类样本,合成的每个少数类样本的特征由两部分组成,一部分是特征选择的特征列对应的特征,另一部分是按照SMOTE原理合成的特征。将基于特征选择的过抽样算法和SMOTE算法进行实验比较,结果表明基于特征选择的过抽样算法的性能优于SMOTE算法.能有效降低数据的不平衡性,提高少数类的分类精度。 |
---|---|
AbstractList | TP311.13; 为了提高不平衡数据集分类中少数类的分类精度,提出了基于特征选择的过抽样算法.该算法考虑了不同的特征列对分类性能的不同作用,首先对训练集进行特征选择,选出一组特征列,然后根据选出的特征列合成少数类样本,合成的每个少数类样本的特征由两部分组成,一部分是特征选择的特征列对应的特征,另一部分是按照SMOTE原理合成的特征.将基于特征选择的过抽样算法和SMOTE算法进行实验比较,结果表明基于特征选择的过抽样算法的性能优于SMOTE算法,能有效降低数据的不平衡性,提高少数类的分类精度. 为了提高不平衡数据集分类中少数类的分类精度,提出了基于特征选择的过抽样算法。该算法考虑了不同的特征列对分类性能的不同作用,首先对训练集进行特征选择,选出一组特征列,然后根据选出的特征列合成少数类样本,合成的每个少数类样本的特征由两部分组成,一部分是特征选择的特征列对应的特征,另一部分是按照SMOTE原理合成的特征。将基于特征选择的过抽样算法和SMOTE算法进行实验比较,结果表明基于特征选择的过抽样算法的性能优于SMOTE算法.能有效降低数据的不平衡性,提高少数类的分类精度。 |
Author | 陆慧娟 张金伟 马小平 杨小兵 |
AuthorAffiliation | 中国矿业大学信息与电气工程学院,徐州221008 中国计量学院信息工程学院,杭州310018 |
AuthorAffiliation_xml | – name: 中国矿业大学信息与电气工程学院 徐州221008;中国计量学院信息工程学院 杭州310018%中国计量学院信息工程学院 杭州310018%中国矿业大学信息与电气工程学院 徐州221008 |
Author_FL | Zhang Jinwei Yang Xiaobing Ma Xiaoping Lu Huijuan |
Author_FL_xml | – sequence: 1 fullname: Lu Huijuan – sequence: 2 fullname: Zhang Jinwei – sequence: 3 fullname: Ma Xiaoping – sequence: 4 fullname: Yang Xiaobing |
Author_xml | – sequence: 1 fullname: 陆慧娟 张金伟 马小平 杨小兵 |
BookMark | eNpFjztLA0EcxLeIYIz5AJaClnf-93F7t6UEXxCwSX_sPTZe1D3NIsZOQZAoWCmCjWnT2AiKAfXLmDv9Fq4kaDUw82OGmUMVnesUoSUMLhVcrHTczBjtYgBwIADsEsDEtQrYr6Dqnz-L6sZkERDKGQeBq8gZP4w-R9dl_3X8fvZ92i-uhuX9-dfHRXH5Vgxeyse74unWOuXgphw-z6MZJfdMWp9qDbXW11qNTae5vbHVWG06sc98h9GE-kKpKPJjEhBPQARSUMWIEEoyjL0YC4pxyj0SMClTCoGfSOVJwajklNbQ8qT2WGoldTvs5EddbQfDpLfb-_0G2D6z3MKEi6UxoTYmCRl4HqOE22xxmu3kun2Y2ZaDbrYvuyf_zA9JS2mh |
ClassificationCodes | TP311.13 |
ContentType | Journal Article |
Copyright | Copyright © Wanfang Data Co. Ltd. All Rights Reserved. |
Copyright_xml | – notice: Copyright © Wanfang Data Co. Ltd. All Rights Reserved. |
DBID | 2RA 92L CQIGP W92 ~WA NSCOK 2B. 4A8 92I 93N PSX TCJ |
DOI | 10.3969/j.issn.1000-0801.2012.01.017 |
DatabaseName | 维普期刊资源整合服务平台 中文科技期刊数据库-CALIS站点 维普中文期刊数据库 中文科技期刊数据库-工程技术 中文科技期刊数据库- 镜像站点 国家哲学社会科学文献中心 (National Center for Philosophy and Social Sciences Documentation) Wanfang Data Journals - Hong Kong WANFANG Data Centre Wanfang Data Journals 万方数据期刊 - 香港版 China Online Journals (COJ) China Online Journals (COJ) |
DatabaseTitleList | |
DeliveryMethod | fulltext_linktorsrc |
DocumentTitleAlternate | Study of Over-Sampling Method Based on Feature Selection |
DocumentTitle_FL | Study of Over-Sampling Method Based on Feature Selection |
EndPage | 91 |
ExternalDocumentID | dxkx201201017 40554326 |
GrantInformation_xml | – fundername: 国家自然科学基金资助项目(60842009; 60905034; 60974126); 浙江省自然科学基金资助项目 funderid: 国家自然科学基金资助项目(60842009; 60905034; 60974126); (Y1110342) |
GroupedDBID | -0Y 2RA 5XA 5XJ 92L ALMA_UNASSIGNED_HOLDINGS CCEZO CQIGP CUBFJ GROUPED_DOAJ U1G U5S W92 ~WA NSCOK 2B. 4A8 92I 93N PSX TCJ |
ID | FETCH-LOGICAL-c747-43d379ffbb7c282590b0a93f4299fa4115c19311e65284aae3087daf5a943a633 |
ISSN | 1000-0801 |
IngestDate | Thu May 29 04:04:58 EDT 2025 Tue Jan 21 20:53:52 EST 2025 Wed Feb 14 10:31:49 EST 2024 |
IsDoiOpenAccess | true |
IsOpenAccess | true |
IsPeerReviewed | false |
IsScholarly | false |
Issue | 1 |
Keywords | 不平衡数据集 特征选择 过抽样 遗传算法 |
Language | Chinese |
LinkModel | OpenURL |
MergedId | FETCHMERGED-LOGICAL-c747-43d379ffbb7c282590b0a93f4299fa4115c19311e65284aae3087daf5a943a633 |
Notes | To significantly improve the classification performance of the minority class, we present an over-sampling method based on feature selection. Firstly, feature selection is performed on the training data set in order to select a set of key colmnns. Then minority class samples are produced using selected key columns, and each sample consists of two kinds of features. One type of features is characteristic value that is corresponding to the selected key columns, the others is generated according to the principle of SMOTE. Comparing to SMOTE algorithm, results show that the new method performs better than SMOTE, and it can effectively reduce the imbalance of data and improve the classification accuracy of the minority class. 11-2103/TN Lu Huijuan, Zhang Jinwei, Ma Xiaoping, Yang Xiaobing (1. School of Information and Electrical Engineering, China University of Mining & Technology, Xuzhou 221008, China; 2. College of Information Engineering, China Jiliang University, Hangzhou 310018, China) imbalanced data set, featu |
OpenAccessLink | http://dx.doi.org/10.3969/j.issn.1000-0801.2012.01.017 |
PageCount | 5 |
ParticipantIDs | wanfang_journals_dxkx201201017 cass_nssd_40554326 chongqing_primary_40554326 |
PublicationCentury | 2000 |
PublicationDate | 2012 2012-01-01 |
PublicationDateYYYYMMDD | 2012-01-01 |
PublicationDate_xml | – year: 2012 text: 2012 |
PublicationDecade | 2010 |
PublicationTitle | 电信科学 |
PublicationTitleAlternate | Telecommunications Science |
PublicationTitle_FL | Telecommunications Science |
PublicationYear | 2012 |
Publisher | 中国通信学会 人民邮电出版社有限公司 中国计量学院信息工程学院 杭州310018%中国计量学院信息工程学院 杭州310018%中国矿业大学信息与电气工程学院 徐州221008 中国矿业大学信息与电气工程学院 徐州221008 |
Publisher_xml | – name: 人民邮电出版社有限公司 – name: 中国通信学会 – name: 中国矿业大学信息与电气工程学院 徐州221008 – name: 中国计量学院信息工程学院 杭州310018%中国计量学院信息工程学院 杭州310018%中国矿业大学信息与电气工程学院 徐州221008 |
SSID | ssib023646091 ssj0002912124 ssib001102832 ssib000459930 ssib051374496 ssib036437025 ssib017479463 ssib058759007 |
Score | 1.5605092 |
Snippet | 为了提高不平衡数据集分类中少数类的分类精度,提出了基于特征选择的过抽样算法。该算法考虑了不同的特征列对分类性能的不同作用,首先对训练集进行特征选择,选出一组特征... TP311.13; 为了提高不平衡数据集分类中少数类的分类精度,提出了基于特征选择的过抽样算法.该算法考虑了不同的特征列对分类性能的不同作用,首先对训练集进行特征选择,选出... |
SourceID | wanfang cass chongqing |
SourceType | Aggregation Database Publisher |
StartPage | 87 |
SubjectTerms | 不平衡数据集 特征选择 过抽样 遗传算法 |
Title | 基于特征选择的过抽样算法的研究 |
URI | http://lib.cqvip.com/qk/90580X/201201/40554326.html https://www.ncpssd.cn/Literature/articleinfo?id=40554326&type=journalArticle https://d.wanfangdata.com.cn/periodical/dxkx201201017 |
Volume | 28 |
hasFullText | 1 |
inHoldings | 1 |
isFullTextHit | |
isPrint | |
journalDatabaseRights | – providerCode: PRVAON databaseName: DOAJ Directory of Open Access Journals issn: 1000-0801 databaseCode: DOA dateStart: 20090101 customDbUrl: isFulltext: true dateEnd: 99991231 titleUrlDefault: https://www.doaj.org/ omitProxy: true ssIdentifier: ssj0002912124 providerName: Directory of Open Access Journals – providerCode: PRVHPJ databaseName: ROAD: Directory of Open Access Scholarly Resources issn: 1000-0801 databaseCode: M~E dateStart: 20120101 customDbUrl: isFulltext: true dateEnd: 99991231 titleUrlDefault: https://road.issn.org omitProxy: true ssIdentifier: ssib058759007 providerName: ISSN International Centre |
link | http://utb.summon.serialssolutions.com/2.0.0/link/0/eLvHCXMwzV1LaxRBEG5iBPEiBhUTNeSQPsnEefSrjjPZWYIHTxFyW2Z2dhIQNpqNGHIQBUGi4EkRvJhrLl4ExYD6Z8yu_gureiazrRGNnrwMvd3fVld1Nd1V_ahmbF6DLPIsKDw_ioQntF94GZoJXp4ZXfq93NeZjfZ5Qy3dFNdX5MrE5D33dslmvtDd_uW9kn_RKuahXumW7F9otiGKGZhG_eIXNYzfY-mYp5JDmycxTwV9TcpTzQ3wBKgoSdFO5CnQaQbMTBU3CY-BMIBgwVPDkzY32hbFPGlRIvZ5ogkTpxxsURJxkM6_NGGgSmBdyjVwLQyZkZalNo8DC8PMgFiKWzxu1gKJNUDulK1fEoogBmUaQ1CMRaqPxKioCMpxIUBsxIsWi5K2bQIZi8YQxaFFlF0I1phId9UjGHvHthZD7FITJ7ZpDLVIHNScVDSsPLUccejIrKjp44oVlN82H9aPCjjyr6uH7LVqNKS0HxIYHsr_mQ9t-167LsK-QRTFoRYr0kf5sOCqo9b9RJFKqDsdi0XbrcFvWAxDChzlzK02iIGp167qyTc0RwaZgWuGVTZZ9aDbz7N9BArsbE_kFxrydF4ztLF4Az22cpqzp8XWrS1CUHBFfYKdDDWaqHTm937q-jkA7nazNcMbP4AeXVD-OMhURLvfzna9DCItxDiOpTSaHufVzeJvCAGajPbEyyHXp9h8LdK13wmElmMXvWqKBLO23l-9g_atvW7YL7P-qmMZL59lZ2qXdi6uxqcpNrG9do55B6_3v-w_G-18OPj08NuDneHTvdGrR18_Px4--TjcfT9683L49gXmjHafj_benWfL7XR5ccmrn2bxulpoT0RFpKEs81x36fI7-LmPQ3xJxm2ZCfQyu-gYBkFPSTR_s6xHcUeLrJQZiChTUXSBTfbX-72LbA5UkefoF1FcTdEF_CEynCQg74FSeSin2RQJ3OkPBkUHvUsp0OGcZjON-J3bVVgep3C2bo9OPVYPOj8ofeZPgEvsNKWrldbLbHJz427vCvoem_msXbObtb3lOxe70hM |
linkProvider | ISSN International Centre |
openUrl | ctx_ver=Z39.88-2004&ctx_enc=info%3Aofi%2Fenc%3AUTF-8&rfr_id=info%3Asid%2Fsummon.serialssolutions.com&rft_val_fmt=info%3Aofi%2Ffmt%3Akev%3Amtx%3Ajournal&rft.genre=article&rft.atitle=%E5%9F%BA%E4%BA%8E%E7%89%B9%E5%BE%81%E9%80%89%E6%8B%A9%E7%9A%84%E8%BF%87%E6%8A%BD%E6%A0%B7%E7%AE%97%E6%B3%95%E7%9A%84%E7%A0%94%E7%A9%B6&rft.jtitle=%E7%94%B5%E4%BF%A1%E7%A7%91%E5%AD%A6&rft.au=%E9%99%86%E6%85%A7%E5%A8%9F&rft.au=%E5%BC%A0%E9%87%91%E4%BC%9F&rft.au=%E9%A9%AC%E5%B0%8F%E5%B9%B3&rft.au=%E6%9D%A8%E5%B0%8F%E5%85%B5&rft.date=2012&rft.pub=%E4%B8%AD%E5%9B%BD%E8%AE%A1%E9%87%8F%E5%AD%A6%E9%99%A2%E4%BF%A1%E6%81%AF%E5%B7%A5%E7%A8%8B%E5%AD%A6%E9%99%A2+%E6%9D%AD%E5%B7%9E310018%25%E4%B8%AD%E5%9B%BD%E8%AE%A1%E9%87%8F%E5%AD%A6%E9%99%A2%E4%BF%A1%E6%81%AF%E5%B7%A5%E7%A8%8B%E5%AD%A6%E9%99%A2+%E6%9D%AD%E5%B7%9E310018%25%E4%B8%AD%E5%9B%BD%E7%9F%BF%E4%B8%9A%E5%A4%A7%E5%AD%A6%E4%BF%A1%E6%81%AF%E4%B8%8E%E7%94%B5%E6%B0%94%E5%B7%A5%E7%A8%8B%E5%AD%A6%E9%99%A2+%E5%BE%90%E5%B7%9E221008&rft.issn=1000-0801&rft.volume=28&rft.issue=1&rft.spage=87&rft.epage=91&rft_id=info:doi/10.3969%2Fj.issn.1000-0801.2012.01.017&rft.externalDocID=dxkx201201017 |
thumbnail_s | http://utb.summon.serialssolutions.com/2.0.0/image/custom?url=http%3A%2F%2Fimage.cqvip.com%2Fvip1000%2Fqk%2F90580X%2F90580X.jpg http://utb.summon.serialssolutions.com/2.0.0/image/custom?url=http%3A%2F%2Fwww.wanfangdata.com.cn%2Fimages%2FPeriodicalImages%2Fdxkx%2Fdxkx.jpg |