刘鑫
- 作品数:3 被引量:2H指数:1
- 供职机构:西北师范大学计算机科学与工程学院更多>>
- 发文基金:国家自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 中文实体集合自动扩展技术研究
- 中文实体集合自动扩展技术的研究已经从传统的限定类别、限定领域的任务发展到开放类别、开放领域的自动抽取。科研领域和应用领域的需求,给实体集合扩展提出了更多的要求。目前主流的方法都是模版法,由于种子存在一词多义和语义模糊的特...
- 刘鑫
- 关键词:语义特征直角坐标系百度百科
- 文献传递
- 结合语境与布朗聚类特征的上下位关系验证被引量:1
- 2015年
- 对海量文本语料进行上下位语义关系自动抽取是自然语言处理的重要内容,利用简单模式匹配方法抽取得到候选上下位关系后,对其进行验证过滤是难点问题。为此,分别通过对词汇语境相似度与布朗聚类相似度计算,提出一种结合语境相似度和布朗聚类相似度特征对候选下位词集合进行聚类的上下位关系验证方法。通过对少量已标注训练语料的语境相似度和布朗聚类相似度进行计算,得到验证模型和2种相似度的结合权重系数。该方法无需借助现有的词汇关系词典和知识库,可对上下位关系抽取结果进行有效过滤。在CCF NLP&2012词汇语义关系评测语料上进行实验,结果表明,与模式匹配和上下文比较等方法相比,该方法可使F值指标得到明显提升。
- 张志昌陈松毅刘鑫马慧芳
- 关键词:上下位关系
- 面向经济领域的同义词获取融合方法研究被引量:1
- 2014年
- 随着互联网新技术的不断发展和信息的爆炸式增长,自然语言处理和信息检索等技术在信息的处理和获取方面呈现愈加重要的作用,而同义词又在各种自然语言处理和信息检索应用中有着重要的研究意义和应用价值。基于此,提出一种面向经济领域的字面相似和PageRank链接融合的同义词方法,可从海量语料库中获取大量的同义词集合。
- 马海昌张志昌赵学锋刘鑫孔波
- 关键词:同义词