单触发序列突发漂移检测算法

TP311; 针对现有的漂移检测算法不适用于解决单触发序列的漂移问题,提出一种基于活动距离变化的突发漂移检测方法.首先,提取每个滑动窗口中活动的关系矩阵来获取关系的特征向量;其次,为了降低关系矩阵的维度,通过计算滑动窗口之间活动的杰卡德距离,将活动的关系矩阵转换为杰卡德距离分布矩阵;然后,采用KL散度比较相邻距离矩阵中概率分布的变化来定位漂移区间;最后,为了解决粒度大小引起的不确定性问题,以循环关系的位置为窗口大小依次遍历并求得漂移区间的交集来定位漂移点.通过实验对包含12种变更模式且每种模式有5个不同大小日志的模拟数据集和两个软件仓库的执行日志的真实数据集进行了评估.结果表明,该方法可以对单...

Full description

Saved in:
Bibliographic Details
Published in计算机集成制造系统 Vol. 27; no. 9; pp. 2636 - 2646
Main Authors 原佳怡, 朱锐, 林雷蕾, 李彤, 郑明
Format Journal Article
LanguageChinese
Published 云南省软件工程重点实验室,云南 昆明 650091%清华大学 软件学院,北京 100084%云南省软件工程重点实验室,云南 昆明 650091 01.09.2021
云南农业大学 大数据学院,云南 昆明 650201%云南大学 信息学院,云南 昆明 650500
云南大学 软件学院,云南 昆明 650091
山西师范大学 教师教育学院,山西 太原 030092%云南大学 软件学院,云南 昆明 650091
Subjects
Online AccessGet full text
ISSN1006-5911
DOI10.13196/j.cims.2021.09.016

Cover

More Information
Summary:TP311; 针对现有的漂移检测算法不适用于解决单触发序列的漂移问题,提出一种基于活动距离变化的突发漂移检测方法.首先,提取每个滑动窗口中活动的关系矩阵来获取关系的特征向量;其次,为了降低关系矩阵的维度,通过计算滑动窗口之间活动的杰卡德距离,将活动的关系矩阵转换为杰卡德距离分布矩阵;然后,采用KL散度比较相邻距离矩阵中概率分布的变化来定位漂移区间;最后,为了解决粒度大小引起的不确定性问题,以循环关系的位置为窗口大小依次遍历并求得漂移区间的交集来定位漂移点.通过实验对包含12种变更模式且每种模式有5个不同大小日志的模拟数据集和两个软件仓库的执行日志的真实数据集进行了评估.结果表明,该方法可以对单触发序列的突发漂移进行有效定位.
ISSN:1006-5911
DOI:10.13196/j.cims.2021.09.016