XSLC:分层编码并面向查询的XML数据压缩算法

TP393; XML(extensible mallkup language)文档已经被广泛用作应用程序的一个数据交换格式,针对XML数据的压缩技术也逐渐成为新的研究领域.提出XSLC(XML stream layerecl-coding compression)算法,通过预先扫描DTD对数据模式进行分析,继而根据元素的父子关系进行子元素层面的编码;同时根据数据类型进行数据压缩,能够在压缩之后的文档上进行查询,因为仅需一遍压缩扫描所以可以应用于数据流环境.实验表明:XSLC算法的压缩比率和压缩时间均优于传统算法....

Full description

Saved in:
Bibliographic Details
Published in计算机科学与探索 Vol. 4; no. 2; pp. 145 - 152
Main Authors 付强, 王腾蛟, 李红燕, 杨冬青, 唐世渭
Format Journal Article
LanguageChinese
Published 北京大学,高可信软件技术教育部重点实验室,北京,100871%北京大学,信息科学技术学院,北京,100871 2010
北京大学,机器感知与智能教育部重点实验室,北京,100871
北京大学,信息科学技术学院,北京,100871
Subjects
Online AccessGet full text
ISSN1673-9418
DOI10.3778/j.issn.1673-9418.2010.02.006

Cover

More Information
Summary:TP393; XML(extensible mallkup language)文档已经被广泛用作应用程序的一个数据交换格式,针对XML数据的压缩技术也逐渐成为新的研究领域.提出XSLC(XML stream layerecl-coding compression)算法,通过预先扫描DTD对数据模式进行分析,继而根据元素的父子关系进行子元素层面的编码;同时根据数据类型进行数据压缩,能够在压缩之后的文档上进行查询,因为仅需一遍压缩扫描所以可以应用于数据流环境.实验表明:XSLC算法的压缩比率和压缩时间均优于传统算法.
ISSN:1673-9418
DOI:10.3778/j.issn.1673-9418.2010.02.006