FilterFA:一种基于字符集规约的模式串匹配算法
TN925; 多模式串匹配技术是入侵检测系统的核心技术之一,Aho-Corasick算法广泛应用于其中.针对AC自动机内存开销巨大影响算法性能的问题,提出一种基于字符集规约的改进算法——FilterFA.利用字符集映射函数将原字符集压缩为多个像字符集,针对像字符集构造新的自动机FilterFA,将空间复杂度降至O(|P||Σ'|).在随机数据集和真实数据集ClamAV上的测试结果表明,当像字符集大小为8,且保证误识别率小于2%时,FilterFA算法消耗的存储空间仅为AC算法的3%左右....
        Saved in:
      
    
          | Published in | 通信学报 Vol. 37; no. 12; pp. 103 - 114 | 
|---|---|
| Main Authors | , , , , , | 
| Format | Journal Article | 
| Language | Chinese | 
| Published | 
            信息内容安全技术国家工程实验室,北京100093%中国移动(深圳)有限公司,深圳,518031%中国科学院信息工程研究所,北京100093
    
        2016
     信息内容安全技术国家工程实验室,北京100093 中国科学院信息工程研究所,北京100093 中国科学院大学,北京100049  | 
| Subjects | |
| Online Access | Get full text | 
| ISSN | 1000-436X | 
| DOI | 10.11959/j.issn.1000-436x.2016277 | 
Cover
| Summary: | TN925; 多模式串匹配技术是入侵检测系统的核心技术之一,Aho-Corasick算法广泛应用于其中.针对AC自动机内存开销巨大影响算法性能的问题,提出一种基于字符集规约的改进算法——FilterFA.利用字符集映射函数将原字符集压缩为多个像字符集,针对像字符集构造新的自动机FilterFA,将空间复杂度降至O(|P||Σ'|).在随机数据集和真实数据集ClamAV上的测试结果表明,当像字符集大小为8,且保证误识别率小于2%时,FilterFA算法消耗的存储空间仅为AC算法的3%左右. | 
|---|---|
| ISSN: | 1000-436X | 
| DOI: | 10.11959/j.issn.1000-436x.2016277 |