朱峰
- 作品数:2 被引量:7H指数:2
- 供职机构:南京师范大学计算机科学与技术学院更多>>
- 发文基金:国家自然科学基金江苏省普通高校研究生科研创新计划项目江苏省高等学校自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于知识图谱的未登录词语义研究被引量:2
- 2017年
- 传统的应用于未登录词语义研究的语料库包含许多限制,例如更新慢、语言相关等。为了解决此问题,提出了基于知识图谱的中文未登录词语义研究方法。知识图谱是一种包含实体、概念及语义关系的语义网络。它具有丰富的实体,并且实体及其关系的添加极为方便,使得弥补传统语料库更新慢的缺憾成为可能。在充分熟悉知识图谱的结构、数据获取方法及相关数据处理方法后,进行基于知识图谱的未登录词语义研究的探索工作,最后以百度百科(目前最大的中文知识图谱)为语料资源,在同一语义分析模型下分别进行基于知识图谱与传统语料的实验,对实验结果进行分析并提出改进方法。
- 朱峰顾敏郑好顾彦慧周俊生曲维光
- 关键词:语义标注知识图谱
- 基于结构和文本特征的网页分类技术研究被引量:5
- 2017年
- Web网页中含有丰富的信息资源,通过网页分类可以更好地对其内容进行抽取和管理,方便用户阅读.针对网页复杂的结构信息和丰富的文本内容,提出了一种基于网页文本和结构的网页分类方法,利用众创相关网页的结构特点和文本信息,选择联合特征和原子特征相结合的方法进行分类.实验表明,这种方法有一定的可行性,且比单一使用文本信息进行分类的方法具有更高的正确率和召回率.
- 顾敏郭庆曹野朱峰顾彦慧周俊生曲维光
- 关键词:网页分类朴素贝叶斯