基于MapReduce的HDFS数据窃取随机检测算法

TP311.1; 为了解决分布式云计算存储的数据窃取检测中,出现数据量大、内部窃取难以检测的问题,以hadoop分布式文件系统(HDFS,hadoop distributed file system)为检测对象,提出了一种基于MapReduce的数据窃取随机检测算法.分析HDFS文件夹复制产生的MAC时间戳特性,确立复制行为的检测与度量方法,确保能够检测包括内部窃取的所有窃取模式.设计适合于MapReduce任意的任务划分,同时记录HDFS层次关系的输入数据集,实现海量时间戳数据的高效分析.实验结果表明,该算法能够通过分段检测策略很好地控制漏检率和误检文件夹数量,并且具有较高的执行效率和良好的...

Full description

Saved in:
Bibliographic Details
Published in通信学报 Vol. 39; no. 10; pp. 11 - 21
Main Authors 高元照, 李炳龙, 陈性元
Format Journal Article
LanguageChinese
Published 信息工程大学三院,河南郑州 450001 25.10.2018
密码科学技术国家重点实验室,北京 100094%信息工程大学三院,河南郑州,450001
Subjects
Online AccessGet full text
ISSN1000-436X
DOI10.11959/j.issn.1000-436x.2018222

Cover

More Information
Summary:TP311.1; 为了解决分布式云计算存储的数据窃取检测中,出现数据量大、内部窃取难以检测的问题,以hadoop分布式文件系统(HDFS,hadoop distributed file system)为检测对象,提出了一种基于MapReduce的数据窃取随机检测算法.分析HDFS文件夹复制产生的MAC时间戳特性,确立复制行为的检测与度量方法,确保能够检测包括内部窃取的所有窃取模式.设计适合于MapReduce任意的任务划分,同时记录HDFS层次关系的输入数据集,实现海量时间戳数据的高效分析.实验结果表明,该算法能够通过分段检测策略很好地控制漏检率和误检文件夹数量,并且具有较高的执行效率和良好的可扩展性.
ISSN:1000-436X
DOI:10.11959/j.issn.1000-436x.2018222