您的位置: 专家智库 > >

北京市自然科学基金(4073043)

作品数:1 被引量:4H指数:1
相关作者:赵军韩先培更多>>
相关机构:中国科学院自动化研究所更多>>
发文基金:北京市自然科学基金国家自然科学基金国家高技术研究发展计划更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 3篇会议论文
  • 1篇期刊文章

领域

  • 3篇自动化与计算...
  • 1篇语言文字

主题

  • 2篇语料
  • 2篇语料库
  • 2篇语料库构建
  • 2篇语义标注
  • 2篇语义元数据
  • 2篇元数据
  • 2篇WIKIPE...
  • 1篇信息处理
  • 1篇语言
  • 1篇语言特征
  • 1篇语义
  • 1篇中文
  • 1篇中文信息
  • 1篇中文信息处理
  • 1篇网页

机构

  • 4篇中国科学院自...

作者

  • 4篇赵军
  • 1篇刘康
  • 1篇韩先培
  • 1篇段湘煜
  • 1篇徐波

传媒

  • 1篇中文信息学报

年份

  • 1篇2009
  • 1篇2008
  • 2篇2007
1 条 记 录,以下是 1-4
排序方式:
基于Wikipedia的语义元数据生成
语义元数据提供数据的语义信息,在数据的理解、管理、发现和交换中起着极为重要的作用。随着互联网上数据爆炸式的增长,对自动元数据生成技术的需求也就变得更加迫切。获得目标语义元数据及得到足够的训练语料是使用自动生成技术的两个基...
韩先培赵军
关键词:元数据语义元数据语料库构建语义标注
文献传递
基于Wikipedia的语义元数据生成被引量:4
2009年
语义元数据提供数据的语义信息,在数据的理解、管理、发现和交换中起着极为重要的作用。随着互联网上数据爆炸式的增长,对自动元数据生成技术的需求也就变得更加迫切。获得目标语义元数据及得到足够的训练语料是使用自动生成技术的两个基本问题。由于获得目标语义元数据需要专家知识,而获得足够的训练语料需要大量的手工工作,这也就使得这两个问题在构建一个成功的系统时至关重要。该文基于Wikipedia来解决这两个问题:通过分析一个类别中条目的目录表(table-of-contents)来抽取目标语义元数据,通过对分析文档结构和赋予目标结构正确的语义元数据来构建训练语料库。实验结果表明,该文的方法能够有效地解决这两个问题,为进一步的大规模的语义元数据应用系统打下了坚实的基础。
韩先培赵军
关键词:中文信息处理元数据语义元数据语料库构建语义标注
基于布局特征与语言特征的网页主要内容块发现
本文综合分析了网页内容块各方面的特征,提出了一个联合使用布局特征和语言特征的网页主要内容块发现方法,有效地解决了以往模型中通用性与高准确率不能共存的缺点。该方法使用网页视觉块树表示网页,对网页内容块的布局特征和语言特征分...
韩先培刘康赵军
关键词:语言特征
文献传递
基于动作建模的中文依存句法分析
决策式依存句法分析,也就是基于分析动作的句法分析方法,常常被认为是一种高效的分析算法,但是它的性能稍低于一些更复杂的句法分析模型。本文将决策式句法分析同产生式、判别式句法分析这些复杂模型做了比较,试验数据采用宾州中文树库...
段湘煜赵军徐波
文献传递
共1页<1>
聚类工具0