山东省自然科学基金(2009ZRB019RW)
- 作品数:1 被引量:14H指数:1
- 相关作者:张传岩洪晓光李庆忠彭朝晖更多>>
- 相关机构:山东大学更多>>
- 发文基金:山东省自然科学基金山东省科技攻关计划国家自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 元数据驱动的SAAS应用交付平台
- 随着SaaS的兴起,支持ISV方便快捷的构建SaaS应用的平台即服务(PaaS)理念也发展起来。本文设计并实现了一个元数据驱动的SaaS应用交付平台,该平台通过元数据驱动的映射转换机制支持ISV在传统开发环境中离线开发遵...
- 孔兰菊李庆忠郑旭旭陈维良
- 关键词:SAAS元数据驱动映射机制
- 基于路径索引的XML小枝模式匹配方法
- 小枝模式匹配作为XML查询的核心操作,目前在该方面已经提出了一系列有效的实现方法.在总结分析先前各种匹配算法的基础上,提出了一种新的基于路径索引的解决方法TwigFilter,该方法是一个单阶段算法,避免了路径归并.同时...
- 胡叶洪晓光王兰野
- 关键词:XML路径索引
- 文献传递
- DWDIS:面向分析的Deep Web数据集成系统
- 传统Deep Web数据集成研究侧重满足用户的即时查询需求,对数据分析应用缺乏充分支持,提出一个面向分析的Deep Web数据集成系统DWDIS,能够在较少人工参与下对大量Web数据库进行高质量数据获取、抽取和整合,为分...
- 闫中敏李庆忠彭朝晖董永权丁艳辉张永新徐秀星
- 关键词:数据集成数据分析
- 文献传递
- 基于SVM和扩展条件随机场的Web实体活动抽取被引量:14
- 2012年
- 在传统信息抽取的基础上,研究Web实体活动抽取,基于格语法对实体活动进行了形式化定义,并提出一种基于SVM(supported vector machine)和扩展条件随机场的Web实体活动抽取方法,能够从Web上准确地抽取实体的活动信息.首先,为了避免人工标注训练数据的繁重工作,提出一种基于启发式规则的训练数据生成算法,将语义角色标注的训练数据集转化为适合Web实体活动抽取的训练数据集,分别训练支持向量机分类器和扩展条件随机场.在抽取过程中,通过分类器获得包含实体活动的语句,然后利用扩展条件随机场对传统条件随机场中不能利用的标签频率特征和关系特征建模,标注自然语句中的待抽取信息,提高标注的准确率.通过多领域的实验,其结果表明,所提出的抽取方法能够较好地适用于Web实体活动抽取.
- 张传岩洪晓光彭朝晖李庆忠
- 关键词:信息抽取格语法支持向量机