一种基于支持向量机的主动度量学习算法

TP391; 度量学习是机器学习领域的重要研究内容.度量结果的优劣会直接影响后续机器学习算法的性能.目前大多度量学习的研究工作都是在有监督环境下进行的.然而,实际应用中往往存在大量数据没有标记或需要付出昂贵代价才能获得标记的问题.针对这一问题,提出一种适用于半监督环境的基于支持向量机的主动度量学习算法(ASVM2 L).首先,从待学习无标记样本中随机选择少量样本交予专家标注,再利用这些样本训练支持向量机度量学习器;然后,根据度量学习结果,采用不同K近邻分类器对剩余未标记样本进行分类评估,选择表决差异最大的样本交予专家标注,再加入训练集重新进行度量学习;重复执行上述步骤至满足终止条件,以保证在有...

Full description

Saved in:
Bibliographic Details
Published in计算机科学 Vol. 49; no. z1; pp. 113 - 118
Main Authors 侯夏晔, 陈海燕, 张兵, 袁立罡, 贾亦真
Format Journal Article
LanguageChinese
Published 南京航空航天大学计算机科学与技术学院 南京211106%南京航空航天大学计算机科学与技术学院 南京211106 2022
软件新技术与产业化协同创新中心 南京210023%南京航空航天大学民航学院 南京211106
Subjects
Online AccessGet full text
ISSN1002-137X
DOI10.11896/jsjkx.210500034

Cover

More Information
Summary:TP391; 度量学习是机器学习领域的重要研究内容.度量结果的优劣会直接影响后续机器学习算法的性能.目前大多度量学习的研究工作都是在有监督环境下进行的.然而,实际应用中往往存在大量数据没有标记或需要付出昂贵代价才能获得标记的问题.针对这一问题,提出一种适用于半监督环境的基于支持向量机的主动度量学习算法(ASVM2 L).首先,从待学习无标记样本中随机选择少量样本交予专家标注,再利用这些样本训练支持向量机度量学习器;然后,根据度量学习结果,采用不同K近邻分类器对剩余未标记样本进行分类评估,选择表决差异最大的样本交予专家标注,再加入训练集重新进行度量学习;重复执行上述步骤至满足终止条件,以保证在有限的标记样本子集下能获得最佳的度量学习矩阵.在标准数据集上的对比实验验证了所提ASVM2 L算法能在不影响分类精度的前提下,利用最少的标记样本获得更多的标记信息,因而具有更好的度量性能.
ISSN:1002-137X
DOI:10.11896/jsjkx.210500034