您的位置: 专家智库 > >

杜会芳

作品数:5 被引量:53H指数:2
供职机构:中国农业大学更多>>
发文基金:国家自然科学基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 3篇专利
  • 2篇期刊文章

领域

  • 3篇自动化与计算...

主题

  • 4篇非分类关系
  • 3篇植物
  • 2篇信息处理
  • 2篇语料
  • 2篇中文
  • 2篇中文信息
  • 2篇中文信息处理
  • 2篇向量
  • 2篇非结构化
  • 2篇词条
  • 1篇饮食
  • 1篇饮食健康
  • 1篇网络
  • 1篇网页
  • 1篇网页内容
  • 1篇网站
  • 1篇文本
  • 1篇文本分类
  • 1篇领域本体
  • 1篇领域知识

机构

  • 5篇中国农业大学
  • 1篇公安部第三研...

作者

  • 5篇赵明
  • 5篇杜会芳
  • 4篇陈瑛
  • 3篇杜亚茹
  • 3篇张家军
  • 2篇彭珺
  • 1篇陈长松
  • 1篇王红说

传媒

  • 2篇农业机械学报

年份

  • 1篇2019
  • 2篇2017
  • 2篇2016
5 条 记 录,以下是 1-5
排序方式:
一种针对植物领域的非分类关系识别方法
本发明公开了属于计算机中文信息处理领域的一种针对植物领域的非分类关系识别方法。根据对植物领域关系的分类,对分类关系和非分类关系进行定义;获取相关词条的非结构化网页内容,作为语料并进行预处理,获得预处理模块;然后再进行基于...
赵明杜会芳杜亚茹陈瑛张家军彭珺
文献传递
基于word2vec和LSTM的饮食健康文本分类研究被引量:39
2017年
为了对饮食文本信息高效分类,建立一种基于word2vec和长短期记忆网络(Long-short term memory,LSTM)的分类模型。针对食物百科和饮食健康文本特点,首先利用word2vec实现包含语义信息的词向量表示,并解决了传统方法导致数据表示稀疏及维度灾难问题,基于K-means++根据语义关系聚类以提高训练数据质量。由word2vec构建文本向量作为LSTM的初始输入,训练LSTM分类模型,自动提取特征,进行饮食宜、忌的文本分类。实验采用48 000个文档进行测试,结果显示,分类准确率为98.08%,高于利用tf-idf、bag-of-words等文本数值化表示方法以及基于支持向量机(Support vector machine,SVM)和卷积神经网络(Convolutional neural network,CNN)分类算法结果。实验结果表明,利用该方法能够高质量地对饮食文本自动分类,帮助人们有效地利用健康饮食信息。
赵明杜会芳董翠翠陈长松
关键词:文本分类
一种针对植物领域的非分类关系识别方法
本发明公开了属于计算机中文信息处理领域的一种针对植物领域的非分类关系识别方法。根据对植物领域关系的分类,对分类关系和非分类关系进行定义;获取相关词条的非结构化网页内容,作为语料并进行预处理,获得预处理模块;然后再进行基于...
赵明杜会芳杜亚茹陈瑛张家军彭珺
基于word2vec的远监督非分类关系提取方法及系统
本发明公开一种基于word2vec的远监督非分类关系提取方法及系统,能较准确提取蔬菜领域的非分类关系。方法包括:爬取网络百科和大型蔬菜网站的网络蔬菜领域非结构化文本数据作为语料,对语料依次进行预处理,得到初步的训练语料;...
赵明杜会芳董翠翠陈瑛
文献传递
植物领域知识图谱构建中本体非分类关系提取方法被引量:15
2016年
采用本体学习的方法,以百度百科植物类词条内容的非结构和半结构化中文文本信息作为语料进行处理。使用一种有指导的基于依存句法分析的词汇-语法模式来获取植物领域的概念、分类和非分类关系,并分别利用基于词表过滤的方法和给模式添加限制的方法,较大程度地提高了关系抽取的精确度,完成在轻量级本体的基础上自动构建重量级本体。该方法建立了一个特定领域语料的概念层次,提高了最具代表性的分类和非分类关系的发现,并使用OWL语言形式化表达抽取结果。实验表明,该方法在非分类关系抽取上取得了较好的结果,为该领域知识图谱构建奠定了基础。
赵明杜亚茹杜会芳张家军王红说陈瑛
关键词:非分类关系本体学习百度百科
共1页<1>
聚类工具0