国家科技支撑计划(2009BAH44B02) 作品数:9 被引量:131 H指数:7 相关作者: 李庆忠 史玉良 孔兰菊 彭朝晖 李晓娜 更多>> 相关机构: 山东大学 上海大学 青岛大学 更多>> 发文基金: 国家自然科学基金 国家科技支撑计划 山东省自然科学基金 更多>> 相关领域: 自动化与计算机技术 电子电信 更多>>
基于Markov逻辑网的两阶段数据冲突解决方法 被引量:12 2012年 在数据集成中,如何准确地解决数据冲突是关系集成数据质量的关键问题.现有的方法主要针对单个属性进行冲突解决,由于没有区分不同属性的冲突程度,也没有考虑不同属性间冲突解决的相互影响,导致数据冲突解决的准确率不高.针对现有方法存在的不足,文中提出一种基于Markov逻辑网的两阶段数据冲突解决方法.该方法可以根据冲突程度对属性进行划分,并分两阶段进行处理:(1)在第1阶段,对于弱冲突属性,利用投票规则及事实之间相互印证等简单规则进行冲突解决;(2)在第2阶段,利用了第1阶段冲突解决的结果,在规则中加入数据源与事实之间的相互影响规则、数据源之间相互依赖规则及弱冲突属性对强冲突属性影响规则,对强冲突属性进行冲突解决.通过在大量真实数据上的实验结果证明,该方法能够有效地解决集成数据的冲突问题,具有较高的准确率. 张永新 李庆忠 彭朝晖关键词:MARKOV逻辑网 数据集成 基于扩展图规划的Top-K服务组合方法研究 被引量:6 2012年 自动服务组合是目前云计算中的关键技术与研究热点.为大规模用户提供多个满足个性化需求的组合服务是当前云环境下自动服务组合中急需解决的问题.提出了基于扩展图规划的Top-K服务组合方法,借助服务索引和增加图规划中的辅助节点,使得经过一次规划搜索即可找到Top-K个满足用户QoS要求的组合服务.实验表明,该方法能够有效提高服务组合的效率,并保证服务组合结果的正确性,更加适用于云计算环境下海量网络服务及大规模用户个性化需求的自动服务组合问题. 徐猛 崔立真 李庆忠关键词:TOP-K 面向SaaS应用的数据组合隐私保护机制研究 被引量:38 2010年 软件即服务(SaaS)模式下,业务应用和数据库部署在非完全可信的服务运营商的平台上,租户数据的隐私保护成为SaaS模式应用和推广中一个极大的问题和挑战.基于明文状态下不同SaaS数据属性组合泄露隐私程度的不同,提出一种面向SaaS应用的数据组合隐私保护机制.该隐私保护机制支持租户自定制隐私约束,用来描述数据组合隐私保护需求,将SaaS数据属性切分到不同的数据分块中,利用可信第三方实现数据切片间关联关系的混淆和重构,并基于伪造数据,确保同一数据分块内部数据切片分布的均衡化,实现SaaS数据组合隐私保护和实用性的有效结合.通过分析,证明了隐私保护机制的合理性,并通过实验验证了该隐私保护机制的实用性. 张坤 李庆忠 史玉良关键词:软件即服务 隐私保护 数据分块 基于TLA的SaaS业务流程定制及验证机制研究 被引量:48 2010年 SaaS模式已成为当前流行的软件服务形式.为满足不同租户个性化的业务服务需求,SaaS模式必须提供灵活的定制机制.为此,提出了一个支持租户业务流程定制行为建模及验证的框架.该框架以层次定制行为约束图作为定制指导,通过TLA(Temporal Logic of Actions)对各层的原子定制活动建模,并以此为基础构建租户的全局定制行为,然后基于应用的业务规则约束设计算法验证全局定制行为的正确性;为有效提高租户的定制效率,基于对多租户已有正确定制结果的统计分析,设计定制推荐算法,合理减少验证次数.仿真实验结果证实了该机制的高效性及可靠性. 史玉良 栾帅 李庆忠 董晋利 刘方方关键词:软件即服务 定制 基于Chunk Folding的多租户数据库缓存管理机制 被引量:11 2011年 Chunk Folding是SaaS模式下常用的存储架构之一,通过共享数据库共享架构来存储租户的数据以获取规模经济效益,但基于传统数据库搭建的Chunk Folding共享存储架构,其缓存管理机制缺乏良好的多租户特性,导致数据库性能恶化,租户的SLA得不到保障.为此,提出了基于Chunk Folding的自适应多租户缓存管理机制,该机制以租户的SLA需求作为驱动,依据租户当前访问模式,动态生成缓存单元集并计算缓存单元集的I/O效益,通过贪婪算法来选择缓存单元集,使得租户SLA得到满足的同时最小化缓存资源的消耗.通过实验分析证明了该缓存管理机制的有效性. 姚金成 张世栋 史玉良 李庆忠关键词:缓存管理 SLA 一种面向SaaS应用多级定制模型的缓存技术研究 被引量:1 2011年 对共享架构共享存储的SaaS应用来说,如何实现SaaS应用数据低代价高速查询一直是其中的焦点问题之一。在元数据驱动的SaaS应用多级定制模型中,定制元数据存在层次关系,查询代价较高,普通的数据查询优化机制不足以实现SaaS应用的性能优势。采用元数据传递闭包策略解决该问题,针对多级定制的SaaS应用的特点,提出面向租户的两级缓存模型及查询代价最小的最近最少使用缓存替换算法(Min-QT-LRU算法),实验结果表明,该策略能支持更高效的元数据访问。 孙明 孔兰菊 李庆忠 桑成良 郑旭旭关键词:元数据 缓存替换 基于共享模式的SaaS多租户数据划分机制研究 被引量:10 2012年 对SaaS模式下,对共享模式的多租户数据在云中多节点环境的划分问题进行了研究,提出一种支持SaaS应用的多租户数据划分模型和算法。与目前主要面向分析型应用并且缺乏事务支持的分区技术和云数据库解决方案进行比较,理论分析和实验结果同时表明,该划分机制能有效地实现云环境中系统规模动态扩展,同时最大限度地降低分布式事务代价。 李晓娜 李庆忠 孔兰菊 庞成关键词:SAAS 共享模式 数据划分 一种SaaS交付平台的多租户数据迁移策略 被引量:10 2011年 现有的云数据放置策略未引入SaaS特征,租户作为独立个体的特征被忽略,导致多租户数据的混合放置,常用的数据迁移策略面临着识别及迁移租户数据的挑战。提出一种面向SaaS应用的云中多租户数据动态同步迁移策略,解决了共享存储模式下无法识别SaaS应用租户,难以使用快照、日志等数据库技术进行租户数据迁移的问题。通过SaaS平台数据层面的同步迁移,保证云中各数据节点的负载均衡及良好的用户体验。 孔兰菊 李庆忠 李晓娜关键词:SAAS 数据迁移 基于SVM和扩展条件随机场的Web实体活动抽取 被引量:14 2012年 在传统信息抽取的基础上,研究Web实体活动抽取,基于格语法对实体活动进行了形式化定义,并提出一种基于SVM(supported vector machine)和扩展条件随机场的Web实体活动抽取方法,能够从Web上准确地抽取实体的活动信息.首先,为了避免人工标注训练数据的繁重工作,提出一种基于启发式规则的训练数据生成算法,将语义角色标注的训练数据集转化为适合Web实体活动抽取的训练数据集,分别训练支持向量机分类器和扩展条件随机场.在抽取过程中,通过分类器获得包含实体活动的语句,然后利用扩展条件随机场对传统条件随机场中不能利用的标签频率特征和关系特征建模,标注自然语句中的待抽取信息,提高标注的准确率.通过多领域的实验,其结果表明,所提出的抽取方法能够较好地适用于Web实体活动抽取. 张传岩 洪晓光 彭朝晖 李庆忠关键词:信息抽取 格语法 支持向量机