HybridFA:一种基于统计的AC自动机空间优化技术

TP301.1; 针对高级Aho-Corasick (AC)自动机为提高串匹配速度而造成的空间浪费问题,研究发现数据流对自动机节点的访问规律,据此提出基于数据访问特征的混合自动机构建算法HybridFA.分别研究了基于访问频率、访问层次以及结合上述2种特征对AC自动机的部分节点实现完全化的算法.在Snort、ClamAV、URL等真实数据集上的实验结果表明,HybridFA算法的存储空间低于高级AC自动机的5%.此外,结合访问频率和访问层次的改进算法在保证匹配速度的同时具有更强的数据适应性....

Full description

Saved in:
Bibliographic Details
Published in通信学报 Vol. 36; no. 7; pp. 31 - 39
Main Authors 熊刚, 何慧敏, 于静, 刘燕兵, 郭莉
Format Journal Article
LanguageChinese
Published 中国科学院信息工程研究所,北京,100093%中国移动(深圳)有限公司,深圳,518031 2015
Subjects
Online AccessGet full text
ISSN1000-436X
DOI10.11959/j.issn.1000-436x.2015148

Cover

More Information
Summary:TP301.1; 针对高级Aho-Corasick (AC)自动机为提高串匹配速度而造成的空间浪费问题,研究发现数据流对自动机节点的访问规律,据此提出基于数据访问特征的混合自动机构建算法HybridFA.分别研究了基于访问频率、访问层次以及结合上述2种特征对AC自动机的部分节点实现完全化的算法.在Snort、ClamAV、URL等真实数据集上的实验结果表明,HybridFA算法的存储空间低于高级AC自动机的5%.此外,结合访问频率和访问层次的改进算法在保证匹配速度的同时具有更强的数据适应性.
ISSN:1000-436X
DOI:10.11959/j.issn.1000-436x.2015148