[00789684]XML数据管理技术
交易价格:
面议
所属行业:
类型:
非专利
交易方式:
资料待完善
联系人:
所在地:
- 服务承诺
- 产权明晰
-
资料保密
对所交付的所有资料进行保密
- 如实描述
技术详细介绍
该项目是关于XML数据管理技术研究。其内容包括XML索引、XML查询处理与优化、XML并行处理、XML更新技术、面向对象的XML、XML语义约束。在索引技术方面,提出了XML数据的聚簇存储技术和外延索引技术;在XML查询处理和优化技术方面,提出了基于外延的查询处理和优化技术、基于自动机的查询处理技术、基于签名和基于分片的结构连接技术以及基于后缀树的查询处理技术;在XML并行处理技术,提出了XML数据的并行物理分片策略、并行结构化查询处理技术和处理机的并行调度策略;在XML数据更新技术方面,提出了基于高级数据模型的XML更新语言XML-RL的语法和语义,以及实现XML数据更新语言XML-RL的体系结构;在面向对象的XML技术方面,提出了支持面向对象特征的扩展DTD、扩展DTD的文档有效性验证和基于扩展DTD的面向对象的查询语言。(1)在XML数据的聚簇存储与索引方面,提出了两种XML数据结构聚簇存储策略,称为父子关系聚簇存储技术和兄弟关系聚簇存储技术,分别适用于基于传统树遍历策略的XML数据深度优先查询算法与广度优先查询算法;提出了包括XML外延索引、XML限定外延索引、XML值索引、XML引用索引以及XML路径索引等五种索引结构,并以此为基础实现了若干物理查询操作符,设计并实现了一个XML数据管理原型系统Xbase;(2)在XML查询处理与优化技术方面,提出了XML路径表达式查询处理技术-XML外延连接技术,设计了两种基于外延的XML查询优化策略:路径缩短与补路径策略,显著地提高查询效率;提出了一种在模式空间内进行XML数据查询处理算法-自动机匹配算法。自动机匹配算法以自动机理论作为基础,将数据空间内的XML数据查询操作转换为在模式空间内的查询操作,设计并实现了支持自动机匹配算法的数据结构,包括路径模式树和路径实例树等,并进而改进了自动机匹配算法以达到更高的查询效率;提出了一种基于签名的结构连接处理技术,该方法充分利用XML结构连接中的编码技术,提出了基于范围的签名过滤器,以提高连接效率。在该基础上,又提出了带有指针的签名过滤器,减少了对输入队列元素的多余访问。测试表明,签名过滤技术极大地提高了XML结构连接的效率;(3)在并行XML数据处理技术方面,提出了两类XML数据分片策略:基于数据模式的物理分片策略和基于查询频率的物理分片策略、两种基于静态模式的物理分片策略:基于节点模式的节点实例轮转法(NSNRR)和基于路径模式的路径实例均衡法(PSPIB)两种基于直方图的并行XML结构连接算法:等高直方图连接算法和等宽直方图连接算法和四种处理机调度策略,即平均分配法、比例分配法、组合分配法以及串行分配法;(4)提出了一种面向对象的XML,设计了扩展的XMLDTD和XMLSchema,使之具有一些重要的面向对象的主要特征,包括超元素/子元素关系、元素或属性的重载、元素或属性继承的阻塞、多继承以及继承冲突的处理机制等;(5)提出了一种基于高级数据模型XML-RL的XML数据更新语言,主要包括三种插入语句insert-into,insert-before,insert-before,一种删除操作delete和一种置换操作replace。项目主要研究XML数据的聚簇存储与索引、XML查询处理与优化技术、XML并行处理技术和面向对象的XML技术等,产生了很多重要的研究成果,在国内外学术界产生了广泛的学术影响。该项目发表的文章多次被同行专家引用,其研究工作和学术成果受到国际和国内同行专家的广泛重视和好评,国内外具有很大的影响,具有重要的学术价值和应用前景,将产生很好的社会效益。
该项目是关于XML数据管理技术研究。其内容包括XML索引、XML查询处理与优化、XML并行处理、XML更新技术、面向对象的XML、XML语义约束。在索引技术方面,提出了XML数据的聚簇存储技术和外延索引技术;在XML查询处理和优化技术方面,提出了基于外延的查询处理和优化技术、基于自动机的查询处理技术、基于签名和基于分片的结构连接技术以及基于后缀树的查询处理技术;在XML并行处理技术,提出了XML数据的并行物理分片策略、并行结构化查询处理技术和处理机的并行调度策略;在XML数据更新技术方面,提出了基于高级数据模型的XML更新语言XML-RL的语法和语义,以及实现XML数据更新语言XML-RL的体系结构;在面向对象的XML技术方面,提出了支持面向对象特征的扩展DTD、扩展DTD的文档有效性验证和基于扩展DTD的面向对象的查询语言。(1)在XML数据的聚簇存储与索引方面,提出了两种XML数据结构聚簇存储策略,称为父子关系聚簇存储技术和兄弟关系聚簇存储技术,分别适用于基于传统树遍历策略的XML数据深度优先查询算法与广度优先查询算法;提出了包括XML外延索引、XML限定外延索引、XML值索引、XML引用索引以及XML路径索引等五种索引结构,并以此为基础实现了若干物理查询操作符,设计并实现了一个XML数据管理原型系统Xbase;(2)在XML查询处理与优化技术方面,提出了XML路径表达式查询处理技术-XML外延连接技术,设计了两种基于外延的XML查询优化策略:路径缩短与补路径策略,显著地提高查询效率;提出了一种在模式空间内进行XML数据查询处理算法-自动机匹配算法。自动机匹配算法以自动机理论作为基础,将数据空间内的XML数据查询操作转换为在模式空间内的查询操作,设计并实现了支持自动机匹配算法的数据结构,包括路径模式树和路径实例树等,并进而改进了自动机匹配算法以达到更高的查询效率;提出了一种基于签名的结构连接处理技术,该方法充分利用XML结构连接中的编码技术,提出了基于范围的签名过滤器,以提高连接效率。在该基础上,又提出了带有指针的签名过滤器,减少了对输入队列元素的多余访问。测试表明,签名过滤技术极大地提高了XML结构连接的效率;(3)在并行XML数据处理技术方面,提出了两类XML数据分片策略:基于数据模式的物理分片策略和基于查询频率的物理分片策略、两种基于静态模式的物理分片策略:基于节点模式的节点实例轮转法(NSNRR)和基于路径模式的路径实例均衡法(PSPIB)两种基于直方图的并行XML结构连接算法:等高直方图连接算法和等宽直方图连接算法和四种处理机调度策略,即平均分配法、比例分配法、组合分配法以及串行分配法;(4)提出了一种面向对象的XML,设计了扩展的XMLDTD和XMLSchema,使之具有一些重要的面向对象的主要特征,包括超元素/子元素关系、元素或属性的重载、元素或属性继承的阻塞、多继承以及继承冲突的处理机制等;(5)提出了一种基于高级数据模型XML-RL的XML数据更新语言,主要包括三种插入语句insert-into,insert-before,insert-before,一种删除操作delete和一种置换操作replace。项目主要研究XML数据的聚簇存储与索引、XML查询处理与优化技术、XML并行处理技术和面向对象的XML技术等,产生了很多重要的研究成果,在国内外学术界产生了广泛的学术影响。该项目发表的文章多次被同行专家引用,其研究工作和学术成果受到国际和国内同行专家的广泛重视和好评,国内外具有很大的影响,具有重要的学术价值和应用前景,将产生很好的社会效益。