郭志兵
- 作品数:3 被引量:7H指数:1
- 供职机构:河南科技大学电子信息工程学院更多>>
- 发文基金:教育部科学技术研究重点项目更多>>
- 相关领域:自动化与计算机技术更多>>
- 一种改进的词义排歧算法
- 2010年
- 针对传统基于义原同现频率的汉语词义排歧算法的"盲目性",提出一种"双距离"词义排歧算法,即在计算待排歧词各义项与特征词之间的相关系数时,考虑两个距离因素:特征词与待排歧词之间的空间距离;最近选择该义项的同形歧词与该待排歧词之间的空间距离。实验表明,改进的算法是有效的。
- 郭志兵黄广君卢朝华
- 关键词:相关系数词义排歧
- 基于ICVSM的摘要抽取算法研究
- 摘要抽取是应对现代信息化社会而产生的一种信息提炼技术,它从大篇幅的文本中快速、准确地抽取出能够表达文本主题意思的句子生成文摘,为人们高效获取有用信息提供帮助。本文首先介绍摘要抽取的研究现状及相关技术;然后针对统计和语义相...
- 郭志兵
- 关键词:概念向量空间模型
- 文献传递
- 基于最大熵的汉语介词短语识别研究被引量:7
- 2010年
- 汉语介词短语识别的方法是基于最大熵的统计模型,通过最大熵的介词短语边界自动识别和依存语法错误校正两个处理阶段:先由最大熵模型对介词短语进行识别,然后利用依存树库中介词短语的左右边界词语的依存语法知识,对介词短语右边界的错误识别进行校正,完成了对经过分词和词性标注的句子进行介词短语界定的任务,为进一步的句法分析工作打下良好的基础。实验表明该方法是行之有效的。
- 卢朝华黄广君郭志兵
- 关键词:短语识别最大熵依存语法