基于异构隐式存储的多模式匹配算法

TP301; 提出了紧缩存储型Aho-Corasick算法变体,以异构的按需隐式存储取代同构的例行显式存储,从横向扇出压缩与纵向路径压缩2个方向入手,围绕着压缩稀疏事件表展开,当字符集大小σ=256时可将存储量缩减为原来的0.69%左右,而σ=64K时则达0.004%,即空间复杂度降为原来的(1bσ)/σ左右.依据扇出疏密程度的不同,分类采用了4种有针对性的快速事件定位方法,加之优化的失败迁移,使得存储量的大幅缩减不以速度的明显损失为代价,实验也证实了这一点.适用于需承载大型模式集和较长模式串而对时延和抖动都比较敏感的场合(如在线数据流过滤),在宽字符(如UNICODE型亚洲字符)匹配方面拥有...

Full description

Saved in:
Bibliographic Details
Published inTongxin Xuebao Vol. 30; no. 3; pp. 119 - 124
Main Authors 李志东, 杨武, 张汝波, 王巍
Format Journal Article
LanguageChinese
Published 哈尔滨工程大学,信息安全研究中心,黑龙江,哈尔滨,150001 2009
Editorial Department of Journal on Communications
Subjects
Online AccessGet full text
ISSN1000-436X
DOI10.3321/j.issn:1000-436X.2009.03.019

Cover

More Information
Summary:TP301; 提出了紧缩存储型Aho-Corasick算法变体,以异构的按需隐式存储取代同构的例行显式存储,从横向扇出压缩与纵向路径压缩2个方向入手,围绕着压缩稀疏事件表展开,当字符集大小σ=256时可将存储量缩减为原来的0.69%左右,而σ=64K时则达0.004%,即空间复杂度降为原来的(1bσ)/σ左右.依据扇出疏密程度的不同,分类采用了4种有针对性的快速事件定位方法,加之优化的失败迁移,使得存储量的大幅缩减不以速度的明显损失为代价,实验也证实了这一点.适用于需承载大型模式集和较长模式串而对时延和抖动都比较敏感的场合(如在线数据流过滤),在宽字符(如UNICODE型亚洲字符)匹配方面拥有显著优势.
ISSN:1000-436X
DOI:10.3321/j.issn:1000-436X.2009.03.019