国家自然科学基金(61070038)
- 作品数:3 被引量:3H指数:1
- 相关作者:陈海明倪晓勇冯晓强郑黎晓陆平更多>>
- 相关机构:中国科学院软件研究所中国科学院研究生院中国科学院大学更多>>
- 发文基金:国家自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 一类受限正则表达式的推断算法被引量:1
- 2014年
- XML模式推断问题的主要任务可以归约为从一个句子集合中推断出对应的确定型正则表达式。提出了一类在XML模式中大量出现的受限正则表达式,给出了该类正则表达式的推断算法。该算法首先根据给定的句子集合构造自动机,然后根据自动机和句子集合推断出对应的正则表达式。该算法的时间复杂度为max(O(|V|+|E|),O(L)),其中V和E分别表示自动机的节点集合和边集合,L表示句子集合中所有句子的长度之和。对算法的终止性和正确性进行了证明。
- 冯晓强郑黎晓陈海明
- 关键词:XML模式正则表达式自动机
- 正规树文法的产生式相交判定被引量:2
- 2012年
- 在针对产生式不相交的正规树文法的XML类型检查中,需要对正规树文法的产生式进行相交判定。基于正规树文法的产生式的构成特点,提出了基于自动机的相交判定算法。根据产生式的内容模型即正则表达式,构建相应自动机,判定两个自动机的交是否为空,该算法的时间复杂度为O(‖E1‖.‖E2‖.|∑E1∪∑E2|)。实验结果表明,该算法运行正确且高效,可以应用到针对产生式不相交的正规树文法的XML类型检查中。
- 倪晓勇陈海明
- 关键词:产生式正则表达式自动机
- 确定型语言的相关研究综述
- 2013年
- 随着互联网应用的不断普及,XML(可扩展标记语言)在数据库、数据传输等方面的作用也越来越大。一般而言,XML文档的结构都是由XML模式语言来定义,比如DTD和XML Schema。文章主要对DTD和XML Schema的内容模式约束,即确定型正则表达式进行研究,分别详细介绍确定型表达式、确定型语言、及相关问题的研究现状。文章首先给出确定型表达式的定义及相关概念。接着,介绍几种确定型表达式的判定算法。然后,分析确定型语言的判定、对应确定型表达式的生成、及近似确定型表达式的生成等问题。文章最后还列举一些其他相关问题的研究。
- 陈海明陆平
- 关键词:正则表达式复杂度