国家科技支撑计划(2007BAH05B01)
- 作品数:3 被引量:1H指数:1
- 相关作者:宋培彦张冬梅晋耀红刘宁静更多>>
- 相关机构:北京师范大学更多>>
- 发文基金:国家科技支撑计划更多>>
- 相关领域:自动化与计算机技术更多>>
- 一种面向法治活动的句群级语境形式化方法
- 2010年
- 为了使计算机获得语境中包含的知识,必须对语境进行形式化描述。文中采用演绎的方法,以概念树"法治"为例,根据概念层次网络理论(HNC)世界知识的描述,设计了法治活动的领域句类表示式,将法治领域世界知识融入其中,从而使计算机获得先验知识。然后,结合真实语料分析演示了领域句类表示式对句群分析和语境单元萃取的作用,分析结果证明了领域句类表示式的适用性。最后,结合语境形式化的相关理论,讨论了语境的可计算性和语境知识表示方法,表明领域句类是计算机获取和使用语境知识的有效方法。
- 宋培彦刘宁静
- 关键词:HNC理论自然语言理解知识表示
- 专利文本翻译中复杂长句翻译算法研究
- 2011年
- 针对专利文本翻译中长句翻译的问题,提出了一种句子切分算法,即把长句切分成多个独立的小句后再进行翻译的方法。切分算法使用了概念层次网络(HNC)理论的语义特征来切分小句,切分算法和一个基于规则的基线翻译系统进行了融合,融合后的翻译系统的BLEU值达到0.189 8,比融合前的系统提高了30%。实验结果证明,提出的方法可以有效地改进专利翻译效果。
- 晋耀红
- 关键词:切分机器翻译语义特征概念层次网络
- 一种基于C#正则表达式的汉语文本信息检索方法被引量:1
- 2009年
- C#中的正则表达式可以按照用户指定的模式从非结构化文本中提取信息,简单易用,功能强大。简要介绍C#正则表达式主要的语法格式和功能,结合汉语文本检索的实例,演示其使用方法。上机实验结果表明,C#正则表达式在处理汉语文本时的准确率和效率都是较高的,F值为95.53%。
- 宋培彦张冬梅
- 关键词:正则表达式信息检索中文信息处理