教育部人文社会科学研究基金(09YJC870031)
- 作品数:5 被引量:7H指数:2
- 相关作者:徐健肖卓张智雄邓昭俊更多>>
- 相关机构:中山大学中国科学院更多>>
- 发文基金:教育部人文社会科学研究基金更多>>
- 相关领域:文化科学语言文字自动化与计算机技术更多>>
- 基于领域限定网络检索的术语相似度计算被引量:3
- 2012年
- 在分析基于搜索引擎的术语相似度算法基础上,设计并实现了基于领域限定网络检索的术语相似度算法,通过将语义上下文和领域上下文引入检索式构造过程,有效提升了特定领域术语相似度计算效果。
- 徐健肖卓
- 关键词:网络挖掘
- 科技术语语义相似度计算方法研究综述被引量:1
- 2010年
- 在对当前术语语义相似度计算进行分析研究的基础上,将科技术语相似度计算归纳为基于语料文集的相似度计算和基于开放知识资源的相似度计算,对相似度指标的集成算法进行综述。并对科技术语语义相似度计算在自然语言处理和知识挖掘方面的应用进行总结,对其未来研究发展进行展望,为进一步构建高效的术语相似度计算系统提供良好借鉴。
- 徐健张智雄肖卓邓昭俊
- 关键词:相似度计算
- 基于词语软匹配和修饰词权重差异化的术语相似度算法被引量:2
- 2011年
- 针对现有基于语词的术语相似度典型算法存在的问题,提出了将WordNet和编辑距离计算应用于术语词语匹配过程,并根据术语修饰词的位置赋予特征权重的术语相似度改进算法。和已有算法相比,新的算法在三个方面有所改进。首先,在术语中心词匹配过程中引入WordNet的同义词、近义词检索功能,实现中心词之间的语义匹配;其次,将术语词语的直接匹配改进为基于编辑距离计算的模糊匹配;最后,在计算过程中充分考虑了术语修饰词与中心词之间的距离对修饰词权重分配的影响因素。针对新算法提出了具体的实现步骤,并选取基因工程领域实验数据对改进算法和现有典型算法进行对比评测。实验证明,每种改进方法在单独测试时效果优于或至少不低于Nenadic算法。基于三种改进方法的综合计算方法在计算效果方面具有明显提升。
- 徐健张智雄
- 关键词:相似度计算
- 基于句法依赖关系模板的术语相似度计算方法被引量:1
- 2011年
- 针对现有基于语境特征的术语相似度算法在语境模板生成和匹配过程中存在的不足,提出基于术语的句法依赖关系自动构造术语语境模板,进而通过语境模板匹配计算术语相似度的方法。该方法既能减少语境模板的生成和匹配困难,又将术语语境特征较好地保留在模板中。针对新方法提出具体的实现步骤,并选取基因工程领域实验数据对新方法和现有典型方法进行对比评测。实验证明,新方法在计算效果方面具有明显提升。
- 徐健
- 关键词:相似度计算
- 基于网络知识资源的术语相似度计算方法综述
- 2012年
- 在对当前基于网络知识资源的术语相似度计算相关文献进行分析研究的基础上,将其归纳为基于知识资源的术语相似度计算思路、基于搜索引擎的术语相似度计算思路以及术语相似度指标集成计算思路。对各类计算思路的特点和尚存在的不足进行了总结。最后对基于网络知识资源的术语相似度计算的未来研究发展进行展望,旨在为进一步构建高效的术语相似度计算系统提供良好借鉴。
- 徐健肖卓邓昭俊
- 关键词:相似度计算知识资源搜索引擎