基于粒化可拓决策的属性约简算法研究

TP181; 针对传统属性约简算法利用等价关系计算过程烦琐、运行时间较长的问题,定义能体现属性间相关程度的绝对关联度,提出一种基于粒化可拓决策的属性约简算法.首先,利用K-means聚类算法,对原始数据集进行粒化,得到各簇中心;其次,运用可拓决策理论确定经典域、节域和待评物元,通过计算各簇中属性之间的关联度构建指示矩阵,并计算各属性的指示值;最后,根据指示值,从大到小依次选择属性,实现样本集属性约简.实验结果表明,算法运算速度较快,约简后对数据集分类精度影响小,部分数据集分类精度有所提升,验证了算法的有效性....

Full description

Saved in:
Bibliographic Details
Published in郑州大学学报(理学版) Vol. 54; no. 5; pp. 72 - 81
Main Authors 王君宇, 杨亚锋, 赵佳亮, 代琪, 李丽红
Format Journal Article
LanguageChinese
Published 唐山市工程计算重点实验室 河北 唐山 063210%华北理工大学 理学院 河北 唐山 063210%中国石油大学(北京) 自动化系 北京 102249 01.09.2022
华北理工大学 理学院 河北 唐山 063210
河北省数据科学与应用重点实验室 河北 唐山 063210
Subjects
Online AccessGet full text
ISSN1671-6841
DOI10.13705/j.issn.1671-6841.2021358

Cover

More Information
Summary:TP181; 针对传统属性约简算法利用等价关系计算过程烦琐、运行时间较长的问题,定义能体现属性间相关程度的绝对关联度,提出一种基于粒化可拓决策的属性约简算法.首先,利用K-means聚类算法,对原始数据集进行粒化,得到各簇中心;其次,运用可拓决策理论确定经典域、节域和待评物元,通过计算各簇中属性之间的关联度构建指示矩阵,并计算各属性的指示值;最后,根据指示值,从大到小依次选择属性,实现样本集属性约简.实验结果表明,算法运算速度较快,约简后对数据集分类精度影响小,部分数据集分类精度有所提升,验证了算法的有效性.
ISSN:1671-6841
DOI:10.13705/j.issn.1671-6841.2021358