国家自然科学基金(60573186)
- 作品数:2 被引量:29H指数:2
- 相关作者:林静苑春法曹德芳更多>>
- 相关机构:清华大学更多>>
- 发文基金:国家自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 中文时间信息的TIMEX2自动标注被引量:21
- 2008年
- 为了完善中文时间信息标注规范,实现中文时间短语的自动标注,该文研究并修改国际通用的时间短语标注规范TIMEX2的中文标注草案,以此为基础开发一个基于正则表达式的中文TIMEX2自动标注系统(CTAT)。该系统采用3层候选确定参考时间,并行使用多个模块识别输入句子中的时间短语,通过排序冲突消解确定最终结果。经测试,该系统识别时间短语和将时间信息值解析为标准格式的Fmeasure分别达到了90.15%和83.27%,与其他语言同类系统性能相当。应用该系统标注的语料,为时间信息处理方面的后续研究提供了重要资源。
- 林静曹德芳苑春法
- 关键词:信息处理
- 汉语时间关系抽取与计算被引量:11
- 2009年
- 时间关系普遍存在于时间和事件概念之间,为信息组织提供了一条天然的线索。该文在信息抽取和时间信息标注的基础上,研究汉语中时间与时间、事件与时间和事件与事件之间的时间关系。一方面考虑汉语文本的特点,充分抽取蕴含于语法语义层面中的时间关系;另一方面定义了与文本无关的规则,实现了不同来源信息之间的时间关系的计算。这为信息抽取结果的组织、积累和共享打下了基础,对于事件追踪、多文本摘要等方面的研究也有一定的借鉴意义。
- 林静苑春法
- 关键词:计算机应用中文信息处理信息组织