基于MapReduce的HDFS数据窃取随机检测算法
TP311.1; 为了解决分布式云计算存储的数据窃取检测中,出现数据量大、内部窃取难以检测的问题,以hadoop分布式文件系统(HDFS,hadoop distributed file system)为检测对象,提出了一种基于MapReduce的数据窃取随机检测算法.分析HDFS文件夹复制产生的MAC时间戳特性,确立复制行为的检测与度量方法,确保能够检测包括内部窃取的所有窃取模式.设计适合于MapReduce任意的任务划分,同时记录HDFS层次关系的输入数据集,实现海量时间戳数据的高效分析.实验结果表明,该算法能够通过分段检测策略很好地控制漏检率和误检文件夹数量,并且具有较高的执行效率和良好的...
Saved in:
| Published in | 通信学报 Vol. 39; no. 10; pp. 11 - 21 |
|---|---|
| Main Authors | , , |
| Format | Journal Article |
| Language | Chinese |
| Published |
信息工程大学三院,河南郑州 450001
25.10.2018
密码科学技术国家重点实验室,北京 100094%信息工程大学三院,河南郑州,450001 |
| Subjects | |
| Online Access | Get full text |
| ISSN | 1000-436X |
| DOI | 10.11959/j.issn.1000-436x.2018222 |
Cover
| Summary: | TP311.1; 为了解决分布式云计算存储的数据窃取检测中,出现数据量大、内部窃取难以检测的问题,以hadoop分布式文件系统(HDFS,hadoop distributed file system)为检测对象,提出了一种基于MapReduce的数据窃取随机检测算法.分析HDFS文件夹复制产生的MAC时间戳特性,确立复制行为的检测与度量方法,确保能够检测包括内部窃取的所有窃取模式.设计适合于MapReduce任意的任务划分,同时记录HDFS层次关系的输入数据集,实现海量时间戳数据的高效分析.实验结果表明,该算法能够通过分段检测策略很好地控制漏检率和误检文件夹数量,并且具有较高的执行效率和良好的可扩展性. |
|---|---|
| ISSN: | 1000-436X |
| DOI: | 10.11959/j.issn.1000-436x.2018222 |