基于特征选择的过抽样算法的研究

为了提高不平衡数据集分类中少数类的分类精度,提出了基于特征选择的过抽样算法。该算法考虑了不同的特征列对分类性能的不同作用,首先对训练集进行特征选择,选出一组特征列,然后根据选出的特征列合成少数类样本,合成的每个少数类样本的特征由两部分组成,一部分是特征选择的特征列对应的特征,另一部分是按照SMOTE原理合成的特征。将基于特征选择的过抽样算法和SMOTE算法进行实验比较,结果表明基于特征选择的过抽样算法的性能优于SMOTE算法.能有效降低数据的不平衡性,提高少数类的分类精度。...

Full description

Saved in:
Bibliographic Details
Published in电信科学 Vol. 28; no. 1; pp. 87 - 91
Main Author 陆慧娟 张金伟 马小平 杨小兵
Format Journal Article
LanguageChinese
Published 中国通信学会 2012
人民邮电出版社有限公司
中国计量学院信息工程学院 杭州310018%中国计量学院信息工程学院 杭州310018%中国矿业大学信息与电气工程学院 徐州221008
中国矿业大学信息与电气工程学院 徐州221008
Subjects
Online AccessGet full text
ISSN1000-0801
DOI10.3969/j.issn.1000-0801.2012.01.017

Cover

Abstract 为了提高不平衡数据集分类中少数类的分类精度,提出了基于特征选择的过抽样算法。该算法考虑了不同的特征列对分类性能的不同作用,首先对训练集进行特征选择,选出一组特征列,然后根据选出的特征列合成少数类样本,合成的每个少数类样本的特征由两部分组成,一部分是特征选择的特征列对应的特征,另一部分是按照SMOTE原理合成的特征。将基于特征选择的过抽样算法和SMOTE算法进行实验比较,结果表明基于特征选择的过抽样算法的性能优于SMOTE算法.能有效降低数据的不平衡性,提高少数类的分类精度。
AbstractList TP311.13; 为了提高不平衡数据集分类中少数类的分类精度,提出了基于特征选择的过抽样算法.该算法考虑了不同的特征列对分类性能的不同作用,首先对训练集进行特征选择,选出一组特征列,然后根据选出的特征列合成少数类样本,合成的每个少数类样本的特征由两部分组成,一部分是特征选择的特征列对应的特征,另一部分是按照SMOTE原理合成的特征.将基于特征选择的过抽样算法和SMOTE算法进行实验比较,结果表明基于特征选择的过抽样算法的性能优于SMOTE算法,能有效降低数据的不平衡性,提高少数类的分类精度.
为了提高不平衡数据集分类中少数类的分类精度,提出了基于特征选择的过抽样算法。该算法考虑了不同的特征列对分类性能的不同作用,首先对训练集进行特征选择,选出一组特征列,然后根据选出的特征列合成少数类样本,合成的每个少数类样本的特征由两部分组成,一部分是特征选择的特征列对应的特征,另一部分是按照SMOTE原理合成的特征。将基于特征选择的过抽样算法和SMOTE算法进行实验比较,结果表明基于特征选择的过抽样算法的性能优于SMOTE算法.能有效降低数据的不平衡性,提高少数类的分类精度。
Author 陆慧娟 张金伟 马小平 杨小兵
AuthorAffiliation 中国矿业大学信息与电气工程学院,徐州221008 中国计量学院信息工程学院,杭州310018
AuthorAffiliation_xml – name: 中国矿业大学信息与电气工程学院 徐州221008;中国计量学院信息工程学院 杭州310018%中国计量学院信息工程学院 杭州310018%中国矿业大学信息与电气工程学院 徐州221008
Author_FL Zhang Jinwei
Yang Xiaobing
Ma Xiaoping
Lu Huijuan
Author_FL_xml – sequence: 1
  fullname: Lu Huijuan
– sequence: 2
  fullname: Zhang Jinwei
– sequence: 3
  fullname: Ma Xiaoping
– sequence: 4
  fullname: Yang Xiaobing
Author_xml – sequence: 1
  fullname: 陆慧娟 张金伟 马小平 杨小兵
BookMark eNpFjztLA0EcxLeIYIz5AJaClnf-93F7t6UEXxCwSX_sPTZe1D3NIsZOQZAoWCmCjWnT2AiKAfXLmDv9Fq4kaDUw82OGmUMVnesUoSUMLhVcrHTczBjtYgBwIADsEsDEtQrYr6Dqnz-L6sZkERDKGQeBq8gZP4w-R9dl_3X8fvZ92i-uhuX9-dfHRXH5Vgxeyse74unWOuXgphw-z6MZJfdMWp9qDbXW11qNTae5vbHVWG06sc98h9GE-kKpKPJjEhBPQARSUMWIEEoyjL0YC4pxyj0SMClTCoGfSOVJwajklNbQ8qT2WGoldTvs5EddbQfDpLfb-_0G2D6z3MKEi6UxoTYmCRl4HqOE22xxmu3kun2Y2ZaDbrYvuyf_zA9JS2mh
ClassificationCodes TP311.13
ContentType Journal Article
Copyright Copyright © Wanfang Data Co. Ltd. All Rights Reserved.
Copyright_xml – notice: Copyright © Wanfang Data Co. Ltd. All Rights Reserved.
DBID 2RA
92L
CQIGP
W92
~WA
NSCOK
2B.
4A8
92I
93N
PSX
TCJ
DOI 10.3969/j.issn.1000-0801.2012.01.017
DatabaseName 维普期刊资源整合服务平台
中文科技期刊数据库-CALIS站点
维普中文期刊数据库
中文科技期刊数据库-工程技术
中文科技期刊数据库- 镜像站点
国家哲学社会科学文献中心 (National Center for Philosophy and Social Sciences Documentation)
Wanfang Data Journals - Hong Kong
WANFANG Data Centre
Wanfang Data Journals
万方数据期刊 - 香港版
China Online Journals (COJ)
China Online Journals (COJ)
DatabaseTitleList


DeliveryMethod fulltext_linktorsrc
DocumentTitleAlternate Study of Over-Sampling Method Based on Feature Selection
DocumentTitle_FL Study of Over-Sampling Method Based on Feature Selection
EndPage 91
ExternalDocumentID dxkx201201017
40554326
GrantInformation_xml – fundername: 国家自然科学基金资助项目(60842009; 60905034; 60974126); 浙江省自然科学基金资助项目
  funderid: 国家自然科学基金资助项目(60842009; 60905034; 60974126); (Y1110342)
GroupedDBID -0Y
2RA
5XA
5XJ
92L
ALMA_UNASSIGNED_HOLDINGS
CCEZO
CQIGP
CUBFJ
GROUPED_DOAJ
U1G
U5S
W92
~WA
NSCOK
2B.
4A8
92I
93N
PSX
TCJ
ID FETCH-LOGICAL-c747-43d379ffbb7c282590b0a93f4299fa4115c19311e65284aae3087daf5a943a633
ISSN 1000-0801
IngestDate Thu May 29 04:04:58 EDT 2025
Tue Jan 21 20:53:52 EST 2025
Wed Feb 14 10:31:49 EST 2024
IsDoiOpenAccess true
IsOpenAccess true
IsPeerReviewed false
IsScholarly false
Issue 1
Keywords 不平衡数据集
特征选择
过抽样
遗传算法
Language Chinese
LinkModel OpenURL
MergedId FETCHMERGED-LOGICAL-c747-43d379ffbb7c282590b0a93f4299fa4115c19311e65284aae3087daf5a943a633
Notes To significantly improve the classification performance of the minority class, we present an over-sampling method based on feature selection. Firstly, feature selection is performed on the training data set in order to select a set of key colmnns. Then minority class samples are produced using selected key columns, and each sample consists of two kinds of features. One type of features is characteristic value that is corresponding to the selected key columns, the others is generated according to the principle of SMOTE. Comparing to SMOTE algorithm, results show that the new method performs better than SMOTE, and it can effectively reduce the imbalance of data and improve the classification accuracy of the minority class.
11-2103/TN
Lu Huijuan, Zhang Jinwei, Ma Xiaoping, Yang Xiaobing (1. School of Information and Electrical Engineering, China University of Mining & Technology, Xuzhou 221008, China; 2. College of Information Engineering, China Jiliang University, Hangzhou 310018, China)
imbalanced data set, featu
OpenAccessLink http://dx.doi.org/10.3969/j.issn.1000-0801.2012.01.017
PageCount 5
ParticipantIDs wanfang_journals_dxkx201201017
cass_nssd_40554326
chongqing_primary_40554326
PublicationCentury 2000
PublicationDate 2012
2012-01-01
PublicationDateYYYYMMDD 2012-01-01
PublicationDate_xml – year: 2012
  text: 2012
PublicationDecade 2010
PublicationTitle 电信科学
PublicationTitleAlternate Telecommunications Science
PublicationTitle_FL Telecommunications Science
PublicationYear 2012
Publisher 中国通信学会
人民邮电出版社有限公司
中国计量学院信息工程学院 杭州310018%中国计量学院信息工程学院 杭州310018%中国矿业大学信息与电气工程学院 徐州221008
中国矿业大学信息与电气工程学院 徐州221008
Publisher_xml – name: 人民邮电出版社有限公司
– name: 中国通信学会
– name: 中国矿业大学信息与电气工程学院 徐州221008
– name: 中国计量学院信息工程学院 杭州310018%中国计量学院信息工程学院 杭州310018%中国矿业大学信息与电气工程学院 徐州221008
SSID ssib023646091
ssj0002912124
ssib001102832
ssib000459930
ssib051374496
ssib036437025
ssib017479463
ssib058759007
Score 1.5605092
Snippet 为了提高不平衡数据集分类中少数类的分类精度,提出了基于特征选择的过抽样算法。该算法考虑了不同的特征列对分类性能的不同作用,首先对训练集进行特征选择,选出一组特征...
TP311.13; 为了提高不平衡数据集分类中少数类的分类精度,提出了基于特征选择的过抽样算法.该算法考虑了不同的特征列对分类性能的不同作用,首先对训练集进行特征选择,选出...
SourceID wanfang
cass
chongqing
SourceType Aggregation Database
Publisher
StartPage 87
SubjectTerms 不平衡数据集
特征选择
过抽样
遗传算法
Title 基于特征选择的过抽样算法的研究
URI http://lib.cqvip.com/qk/90580X/201201/40554326.html
https://www.ncpssd.cn/Literature/articleinfo?id=40554326&type=journalArticle
https://d.wanfangdata.com.cn/periodical/dxkx201201017
Volume 28
hasFullText 1
inHoldings 1
isFullTextHit
isPrint
journalDatabaseRights – providerCode: PRVAON
  databaseName: DOAJ Directory of Open Access Journals
  issn: 1000-0801
  databaseCode: DOA
  dateStart: 20090101
  customDbUrl:
  isFulltext: true
  dateEnd: 99991231
  titleUrlDefault: https://www.doaj.org/
  omitProxy: true
  ssIdentifier: ssj0002912124
  providerName: Directory of Open Access Journals
– providerCode: PRVHPJ
  databaseName: ROAD: Directory of Open Access Scholarly Resources
  issn: 1000-0801
  databaseCode: M~E
  dateStart: 20120101
  customDbUrl:
  isFulltext: true
  dateEnd: 99991231
  titleUrlDefault: https://road.issn.org
  omitProxy: true
  ssIdentifier: ssib058759007
  providerName: ISSN International Centre
link http://utb.summon.serialssolutions.com/2.0.0/link/0/eLvHCXMwzV1LaxRBEG5iBPEiBhUTNeSQPsnEefSrjjPZWYIHTxFyW2Z2dhIQNpqNGHIQBUGi4EkRvJhrLl4ExYD6Z8yu_gureiazrRGNnrwMvd3fVld1Nd1V_ahmbF6DLPIsKDw_ioQntF94GZoJXp4ZXfq93NeZjfZ5Qy3dFNdX5MrE5D33dslmvtDd_uW9kn_RKuahXumW7F9otiGKGZhG_eIXNYzfY-mYp5JDmycxTwV9TcpTzQ3wBKgoSdFO5CnQaQbMTBU3CY-BMIBgwVPDkzY32hbFPGlRIvZ5ogkTpxxsURJxkM6_NGGgSmBdyjVwLQyZkZalNo8DC8PMgFiKWzxu1gKJNUDulK1fEoogBmUaQ1CMRaqPxKioCMpxIUBsxIsWi5K2bQIZi8YQxaFFlF0I1phId9UjGHvHthZD7FITJ7ZpDLVIHNScVDSsPLUccejIrKjp44oVlN82H9aPCjjyr6uH7LVqNKS0HxIYHsr_mQ9t-167LsK-QRTFoRYr0kf5sOCqo9b9RJFKqDsdi0XbrcFvWAxDChzlzK02iIGp167qyTc0RwaZgWuGVTZZ9aDbz7N9BArsbE_kFxrydF4ztLF4Az22cpqzp8XWrS1CUHBFfYKdDDWaqHTm937q-jkA7nazNcMbP4AeXVD-OMhURLvfzna9DCItxDiOpTSaHufVzeJvCAGajPbEyyHXp9h8LdK13wmElmMXvWqKBLO23l-9g_atvW7YL7P-qmMZL59lZ2qXdi6uxqcpNrG9do55B6_3v-w_G-18OPj08NuDneHTvdGrR18_Px4--TjcfT9683L49gXmjHafj_benWfL7XR5ccmrn2bxulpoT0RFpKEs81x36fI7-LmPQ3xJxm2ZCfQyu-gYBkFPSTR_s6xHcUeLrJQZiChTUXSBTfbX-72LbA5UkefoF1FcTdEF_CEynCQg74FSeSin2RQJ3OkPBkUHvUsp0OGcZjON-J3bVVgep3C2bo9OPVYPOj8ofeZPgEvsNKWrldbLbHJz427vCvoem_msXbObtb3lOxe70hM
linkProvider ISSN International Centre
openUrl ctx_ver=Z39.88-2004&ctx_enc=info%3Aofi%2Fenc%3AUTF-8&rfr_id=info%3Asid%2Fsummon.serialssolutions.com&rft_val_fmt=info%3Aofi%2Ffmt%3Akev%3Amtx%3Ajournal&rft.genre=article&rft.atitle=%E5%9F%BA%E4%BA%8E%E7%89%B9%E5%BE%81%E9%80%89%E6%8B%A9%E7%9A%84%E8%BF%87%E6%8A%BD%E6%A0%B7%E7%AE%97%E6%B3%95%E7%9A%84%E7%A0%94%E7%A9%B6&rft.jtitle=%E7%94%B5%E4%BF%A1%E7%A7%91%E5%AD%A6&rft.au=%E9%99%86%E6%85%A7%E5%A8%9F&rft.au=%E5%BC%A0%E9%87%91%E4%BC%9F&rft.au=%E9%A9%AC%E5%B0%8F%E5%B9%B3&rft.au=%E6%9D%A8%E5%B0%8F%E5%85%B5&rft.date=2012&rft.pub=%E4%B8%AD%E5%9B%BD%E8%AE%A1%E9%87%8F%E5%AD%A6%E9%99%A2%E4%BF%A1%E6%81%AF%E5%B7%A5%E7%A8%8B%E5%AD%A6%E9%99%A2+%E6%9D%AD%E5%B7%9E310018%25%E4%B8%AD%E5%9B%BD%E8%AE%A1%E9%87%8F%E5%AD%A6%E9%99%A2%E4%BF%A1%E6%81%AF%E5%B7%A5%E7%A8%8B%E5%AD%A6%E9%99%A2+%E6%9D%AD%E5%B7%9E310018%25%E4%B8%AD%E5%9B%BD%E7%9F%BF%E4%B8%9A%E5%A4%A7%E5%AD%A6%E4%BF%A1%E6%81%AF%E4%B8%8E%E7%94%B5%E6%B0%94%E5%B7%A5%E7%A8%8B%E5%AD%A6%E9%99%A2+%E5%BE%90%E5%B7%9E221008&rft.issn=1000-0801&rft.volume=28&rft.issue=1&rft.spage=87&rft.epage=91&rft_id=info:doi/10.3969%2Fj.issn.1000-0801.2012.01.017&rft.externalDocID=dxkx201201017
thumbnail_s http://utb.summon.serialssolutions.com/2.0.0/image/custom?url=http%3A%2F%2Fimage.cqvip.com%2Fvip1000%2Fqk%2F90580X%2F90580X.jpg
http://utb.summon.serialssolutions.com/2.0.0/image/custom?url=http%3A%2F%2Fwww.wanfangdata.com.cn%2Fimages%2FPeriodicalImages%2Fdxkx%2Fdxkx.jpg