福建省社会科学规划项目(2012C021)
- 作品数:4 被引量:120H指数:3
- 相关作者:于娟刘强费庶黄福常更多>>
- 相关机构:福州大学大连职业技术学院更多>>
- 发文基金:福建省社会科学规划项目国家自然科学基金福建省教育厅社会科学研究项目更多>>
- 相关领域:自动化与计算机技术文化科学更多>>
- 基于句法结构分析的同义词识别方法研究被引量:12
- 2013年
- 针对同义词识别方法中因重心后移造成的语义相似度计算偏差问题,提出一种基于句法结构分析的同义词识别方法。首先采用句法结构分析方法处理需要做同义词识别的词(或短语),然后基于同义词词林来计算词(或短语)间的相似度。该方法等价地分析词(或短语)中的各个原子词,从而消除重心后移方法所造成的识别偏差。实验证明,该同义词识别方法性能良好,具有较高的可行性,可以为文本挖掘和语义检索领域提供新思路。
- 于娟尹积栋费庶
- 关键词:同义词识别句法结构分析文本挖掘
- 主题网络爬虫研究综述被引量:103
- 2015年
- 网络信息资源呈指数级增长,面对用户越来越个性化的需求,主题网络爬虫应运而生。主题网络爬虫是一种下载特定主题网页的程序。利用在采集页面过程获得的特定信息,主题网络爬虫抓取的页面都是与主题相关的。基于主题网络爬虫的搜索引擎以及基于主题网络爬虫构建领域语料库等应用已经得到广泛运用。首先介绍了主题爬虫的定义、工作原理;然后介绍了近年来国内外关于主题爬虫的研究状况,并比较了各种爬行策略及相关算法的优缺点;最后提出了主题网络爬虫未来的研究方向。
- 于娟刘强
- 关键词:网络爬虫主题爬虫搜索引擎
- 基于本体结构量化的本体概念映射方法研究被引量:2
- 2015年
- 针对现有本体映射方法对本体结构信息挖掘的缺乏,研究基于结构量化的本体映射方法,以支持本体对齐和互操作等本体集成工程。该方法首先将待映射的两个本体分别描述为树形结构,定义并量化其概念的结构关系;然后,基于概念的结构量化向量计算概念的相似度,从而得到本体概念间的映射。该方法通过量化和挖掘本体结构信息,发现不同本体的不同概念间的语义关系。试验证明,该方法的精确率和召回率较令人满意。
- 黄福常于娟
- 关键词:本体映射概念映射
- OWL应用接口的比较分析被引量:3
- 2015年
- 比较分析了Jena API、ProtégéAPI、OWL API这三种OWL应用接口(API)的特点、所基于的平台、可处理的语言以及描述OWL本体的模型,重点介绍了OWL API的常用基本功能,得出了相关结论:(1)Jena API基于RDF三元组的特点使其不能实现OWL语言的全部功能;(2)OWL API针对OWL语言设计,且支持最新的OWL2语言的结构规范;(3)目前这些API都是基于Java平台的,对于其它平台(如.net平台),尚未见有成熟的API出现。
- 熊振辉于娟
- 关键词:JENAAPIPROTÉGÉAPIOWLAPI