XSLC:分层编码并面向查询的XML数据压缩算法
TP393; XML(extensible mallkup language)文档已经被广泛用作应用程序的一个数据交换格式,针对XML数据的压缩技术也逐渐成为新的研究领域.提出XSLC(XML stream layerecl-coding compression)算法,通过预先扫描DTD对数据模式进行分析,继而根据元素的父子关系进行子元素层面的编码;同时根据数据类型进行数据压缩,能够在压缩之后的文档上进行查询,因为仅需一遍压缩扫描所以可以应用于数据流环境.实验表明:XSLC算法的压缩比率和压缩时间均优于传统算法....
Saved in:
Published in | 计算机科学与探索 Vol. 4; no. 2; pp. 145 - 152 |
---|---|
Main Authors | , , , , |
Format | Journal Article |
Language | Chinese |
Published |
北京大学,高可信软件技术教育部重点实验室,北京,100871%北京大学,信息科学技术学院,北京,100871
2010
北京大学,机器感知与智能教育部重点实验室,北京,100871 北京大学,信息科学技术学院,北京,100871 |
Subjects | |
Online Access | Get full text |
ISSN | 1673-9418 |
DOI | 10.3778/j.issn.1673-9418.2010.02.006 |
Cover
Summary: | TP393; XML(extensible mallkup language)文档已经被广泛用作应用程序的一个数据交换格式,针对XML数据的压缩技术也逐渐成为新的研究领域.提出XSLC(XML stream layerecl-coding compression)算法,通过预先扫描DTD对数据模式进行分析,继而根据元素的父子关系进行子元素层面的编码;同时根据数据类型进行数据压缩,能够在压缩之后的文档上进行查询,因为仅需一遍压缩扫描所以可以应用于数据流环境.实验表明:XSLC算法的压缩比率和压缩时间均优于传统算法. |
---|---|
ISSN: | 1673-9418 |
DOI: | 10.3778/j.issn.1673-9418.2010.02.006 |