吴林
- 作品数:3 被引量:12H指数:2
- 供职机构:北京信息科技大学更多>>
- 发文基金:教育部重点实验室开放基金国家自然科学基金北京市属高等学校人才强教计划资助项目更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于知识库的多层级中文文本查错推理模型被引量:10
- 2012年
- 以往的中文文本查错研究主要针对字词错误,对句法、语义的错误推理研究不够。为此,利用统计模型和大规模人民日报语料库构建并扩充查错知识库,针对文本中字词、语法以及语义3个层次的错误,提出相应的多层级查错推理模型。设计并实现3个层级的文本查错算法,构建自动查错系统进行综合查错。实验结果表明,该系统查错性能较优,召回率达到85.62%。
- 吴林张仰森
- 关键词:中文文本知识库
- 基于多知识源的语义搭配知识获取及表示方法被引量:2
- 2012年
- 为更全面准确地从字词搭配中获取语义搭配信息,提出一种新的语义搭配知识提取模型和知识库的表示方法。利用特殊度度量词语搭配的相关程度,在此基础上,基于知网的语义信息,实现从42万条记录的词语搭配中定量地抽取语义搭配信息。实验结果表明,该方法的语义搭配准确率为92.1%,且较大地扩充了字词搭配的规模。
- 王璐张仰森吴林
- 关键词:词语搭配语义搭配知识获取知识表示
- 《现代汉语语法信息词典》的概率化改造及其应用
- 2011年
- 针对《现代汉语语法信息词典》不能准确描述真实语料的缺陷,设计了构建概率型语法信息词典名词库的存储结构,提出利用统计模型概率化词语属性的方法,建立完整的名词概率化语法信息词典,设计并实现了概率型语法词典应用于语法词典自纠错的算法,实验证明其具有自纠错能力。
- 吴林张仰森王璐
- 关键词:查错纠错