最大化独立有效分类信息率的属性选择

TP18; 粗糙集中的属性选择有着十分重要的应用价值.现有的属性选择方法大多忽视了衡量待选属性所提供的分类信息和冗余信息,以及新增待选属性时已选属性所保留的分类信息三者之间的关联.因此,首先利用传统互信息,定义了有效分类信息率的属性重要性评估函数,并提出了一种基于有效分类信息率的属性选择方法.该属性选择方法可以有效地选择能提供大量有效分类信息同时携带较少冗余信息的待选属性.另外,考虑到新增待选属性对已选属性所保留的分类信息的影响,进一步提出了独立有效分类信息率的概念,并构造一种基于独立分类有效信息率的改进属性选择方法.该改进的属性选择方法能够有助于平衡属性的有效分类信息和冗余信息的关系,同时提...

Full description

Saved in:
Bibliographic Details
Published in计算机科学与探索 Vol. 16; no. 11; pp. 2619 - 2627
Main Authors 柳叶, 代建华, 陈姣龙
Format Journal Article
LanguageChinese
Published 湖南师范大学 智能计算与语言信息处理湖南省重点实验室,长沙 410081 01.11.2022
湖南师范大学 信息科学与工程学院,长沙 410081
Subjects
Online AccessGet full text
ISSN1673-9418
DOI10.3778/j.issn.1673-9418.2104117

Cover

More Information
Summary:TP18; 粗糙集中的属性选择有着十分重要的应用价值.现有的属性选择方法大多忽视了衡量待选属性所提供的分类信息和冗余信息,以及新增待选属性时已选属性所保留的分类信息三者之间的关联.因此,首先利用传统互信息,定义了有效分类信息率的属性重要性评估函数,并提出了一种基于有效分类信息率的属性选择方法.该属性选择方法可以有效地选择能提供大量有效分类信息同时携带较少冗余信息的待选属性.另外,考虑到新增待选属性对已选属性所保留的分类信息的影响,进一步提出了独立有效分类信息率的概念,并构造一种基于独立分类有效信息率的改进属性选择方法.该改进的属性选择方法能够有助于平衡属性的有效分类信息和冗余信息的关系,同时提高属性子集的整体识别能力.最后,从分类性能和统计学检验等方面分别与现有的属性选择方法进行了对比实验,实验结果表明了所提出的两种属性选择方法的有效性.
ISSN:1673-9418
DOI:10.3778/j.issn.1673-9418.2104117