FilterFA:一种基于字符集规约的模式串匹配算法

TN925; 多模式串匹配技术是入侵检测系统的核心技术之一,Aho-Corasick算法广泛应用于其中.针对AC自动机内存开销巨大影响算法性能的问题,提出一种基于字符集规约的改进算法——FilterFA.利用字符集映射函数将原字符集压缩为多个像字符集,针对像字符集构造新的自动机FilterFA,将空间复杂度降至O(|P||Σ'|).在随机数据集和真实数据集ClamAV上的测试结果表明,当像字符集大小为8,且保证误识别率小于2%时,FilterFA算法消耗的存储空间仅为AC算法的3%左右....

Full description

Saved in:
Bibliographic Details
Published in通信学报 Vol. 37; no. 12; pp. 103 - 114
Main Authors 张萍, 何慧敏, 张春燕, 曹聪, 刘燕兵, 谭建龙
Format Journal Article
LanguageChinese
Published 信息内容安全技术国家工程实验室,北京100093%中国移动(深圳)有限公司,深圳,518031%中国科学院信息工程研究所,北京100093 2016
信息内容安全技术国家工程实验室,北京100093
中国科学院信息工程研究所,北京100093
中国科学院大学,北京100049
Subjects
Online AccessGet full text
ISSN1000-436X
DOI10.11959/j.issn.1000-436x.2016277

Cover

More Information
Summary:TN925; 多模式串匹配技术是入侵检测系统的核心技术之一,Aho-Corasick算法广泛应用于其中.针对AC自动机内存开销巨大影响算法性能的问题,提出一种基于字符集规约的改进算法——FilterFA.利用字符集映射函数将原字符集压缩为多个像字符集,针对像字符集构造新的自动机FilterFA,将空间复杂度降至O(|P||Σ'|).在随机数据集和真实数据集ClamAV上的测试结果表明,当像字符集大小为8,且保证误识别率小于2%时,FilterFA算法消耗的存储空间仅为AC算法的3%左右.
ISSN:1000-436X
DOI:10.11959/j.issn.1000-436x.2016277