您的位置: 专家智库 > >

谢飞

作品数:39 被引量:181H指数:7
供职机构:合肥工业大学更多>>
发文基金:国家自然科学基金安徽省自然科学基金安徽省高校省级自然科学研究项目更多>>
相关领域:自动化与计算机技术文化科学交通运输工程机械工程更多>>

文献类型

  • 26篇期刊文章
  • 7篇专利
  • 3篇学位论文
  • 3篇会议论文

领域

  • 28篇自动化与计算...
  • 3篇机械工程
  • 3篇交通运输工程
  • 3篇文化科学
  • 1篇生物学
  • 1篇金属学及工艺
  • 1篇自然科学总论

主题

  • 9篇通配符
  • 8篇文本分类
  • 7篇向量
  • 7篇向量空间
  • 7篇向量空间模型
  • 7篇抽取
  • 6篇新闻
  • 5篇序列模式挖掘
  • 5篇关键词抽取
  • 4篇中文
  • 4篇网页
  • 3篇新闻网
  • 3篇新闻网页
  • 3篇车辆
  • 3篇抽取算法
  • 2篇电机
  • 2篇电机驱动
  • 2篇新闻分类
  • 2篇新闻事件
  • 2篇新闻主题

机构

  • 34篇合肥工业大学
  • 20篇合肥师范学院
  • 4篇佛蒙特大学
  • 2篇安徽大学
  • 2篇中国科学技术...
  • 2篇安徽广播电视...
  • 1篇合肥学院
  • 1篇皖南医学院

作者

  • 39篇谢飞
  • 17篇胡学钢
  • 12篇吴信东
  • 3篇张代胜
  • 3篇台德艺
  • 3篇郭建波
  • 2篇侯宝剑
  • 2篇李星华
  • 2篇王海平
  • 2篇高隽
  • 2篇刘应玲
  • 2篇董学春
  • 2篇马晓文
  • 2篇郭丹
  • 2篇宫雪
  • 1篇朱强
  • 1篇李磊
  • 1篇范庆春
  • 1篇胡学钢
  • 1篇史科

传媒

  • 4篇合肥工业大学...
  • 3篇合肥师范学院...
  • 2篇自动化学报
  • 2篇模式识别与人...
  • 2篇广西师范大学...
  • 2篇第十二届中国...
  • 1篇数据采集与处...
  • 1篇南京大学学报...
  • 1篇计算机工程
  • 1篇云南大学学报...
  • 1篇小型微型计算...
  • 1篇情报学报
  • 1篇软件学报
  • 1篇中文信息学报
  • 1篇计算机工程与...
  • 1篇计算机科学
  • 1篇安徽水利水电...
  • 1篇电脑与电信
  • 1篇合肥学院学报...

年份

  • 2篇2023
  • 2篇2021
  • 1篇2020
  • 2篇2018
  • 5篇2017
  • 2篇2016
  • 3篇2015
  • 2篇2014
  • 2篇2013
  • 4篇2012
  • 2篇2011
  • 2篇2010
  • 4篇2009
  • 2篇2008
  • 3篇2007
  • 1篇2006
39 条 记 录,以下是 1-10
排序方式:
基于密度聚类模式的中文新闻网页关键词提取被引量:3
2009年
关键词在文本聚类/分类、自动摘要、信息检索等领域具有重要地位,然而当前互联网上的众多新闻网页没有提供关键词,人工标注关键词代价巨大,并且大多数已有的关键词自动提取算法都需要建立在人工标注的训练集之上,因而难以实用。由于关键词是文章中较重要且主题关联较凝聚的词的集合,因此提出一种基于密度聚类模式的中文新闻网页关键词提取方法,根据词语之间的共现信息,对网页分词后的词语进行聚类,在分析词语关联度的基础上提取出反映新闻主题的关键词。通过大量随机新闻网页实验结果表明,与单纯的TF/IDF(词频和文档频率倒数的乘积)方法相比,此算法召回率平均提高了7.15%,准确率平均提高了7.075%。
尹倩胡学钢谢飞吴信东
关键词:关键词提取词共现聚类自然语言处理
基于张量空间模型的中文文本分类被引量:2
2010年
针对传统的基于向量的中文文本表示方法预处理过程比较复杂,应用于高维数据容易产生维数灾难的局限性,文章提出了一种基于张量空间模型的中文文本分类方法,用三阶张量表示文本集,将基于向量的kNN分类器扩展到张量上以构建分类器。该方法简化了预处理过程,提高了准确率,并使得更多张量学习方法能够在中文文本分类中得以应用。实验证明其具有较高的分类准确率,有一定的实用价值。
何伟胡学钢谢飞
关键词:文本分类
基于词向量空间模型的文本分类方法
大多文本分类方法是基于向量空间模型的,基于这一模型的文档向量维数较高,导致分类器效率难以提高。针对这一不足,本文提出基于词向量空间模型的文本分类方法。其主要思想是把文本的特征词表示成空间向量,通过训练得到词.类别支持度矩...
董学春胡学钢谢飞吴共庆
关键词:文本分类向量空间模型
文献传递
基于图和LDA主题模型的关键词抽取算法被引量:33
2016年
关键词是表达文档核心内容的最小单元。自动抽取一篇或多篇文档的关键词,较传统的人工标注关键词,能节省大量的时间和人力消耗。本文提出了一种基于图和主题模型的关键词抽取算法,首先利用LDA主题模型,计算出词与词之间的相似性,作为词与词之间的权重并构建一个带权无向词图。与传统TextRank不同的是,图的节点不再是单个的词,而是选择短语作为图的节点。最后,再从这些短语节点中选择Top K个词作为文章的关键词。我们选择了两个公开数据集进行了实验,结果表明我们的算法优于现有的关键词抽取算法。
刘啸剑谢飞吴信东
关键词:关键词抽取
基于位置权重的文本分类被引量:2
2008年
文章研究了基于向量空间模型的文本分类中特征词权重算法,综合考虑特征词在文本中出现的位置信息,提出一种改进算法并给出实验结果。
台德艺谢飞胡学钢
关键词:文本分类向量空间模型
社交网络中隐式事件突发性检测被引量:7
2018年
社交网络与人们的生活息息相关,其上的用户行为可用于检测社交网络中的事件突发性,进而准确定位事件的发生区间.但用户行为易受主观及外部因素的影响,有时会出现隐式事件突发性,给事件突发性检测带来困难.本文针对社交网络中的隐式事件突发性问题,在以社交行为特征进行事件突发性检测的基础上,引入关键词特征,动态调整各个时间窗口的候选关键词,将不同事件与不同的关键词特征绑定,避免事件之间及噪音带来的干扰,实现对隐式事件突发性的准确识别.相关实验表明,本文提出的算法可有效改善现有社交网络中事件突发性检测任务的效果.
介飞谢飞李磊吴信东
关键词:社交网络
基于语义联系的新闻网页关键词抽取被引量:10
2009年
提出一种基于语义联系的新闻网页关键词抽取方法,不仅考虑了词语在知识库《知网》中的语义相似度,还考虑词语在具体上下文中的相关性,用词汇链将词语语义联系表示成图形式,在此基础上抽取出新闻网页关键词。对从网易网站选取120篇有核心提示的新闻网页进行测试,实验结果表明,所提出的方法比基于词频的关键词抽取方法和基于《知网》语义相似度构建词汇链的关键词抽取方法,在准确率和召回率上有很大的提高,当抽取关键词个数为3时,比基于词频方法的准确率和召回率分别提高了27.77%和21.38%。
谢飞吴信东胡学钢李星华江兆中
关键词:关键词抽取词汇链语义联系
结合主题分布与统计特征的关键词抽取方法被引量:7
2017年
传统人工抽取关键词耗时耗力,为了能自动从文档中抽取出高质量的关键词,提出一种关键词自动抽取方法。该方法基于文档和词语的主题信息并结合词语的统计特征为候选词语打分,最终选择TopK得分的候选词作为文档关键词。实验结果表明,该方法在准确率、召回率以及F值上均优于现有的基本关键词抽取方法,能有效从文档中抽取出关键词。
刘啸剑谢飞
关键词:主题分布关键词抽取统计特征主题信息
基于词向量空间模型的中文文本分类方法被引量:15
2007年
大多文本分类方法是基于向量空间模型的,基于这一模型的文本向量维数较高,导致分类器效率难以提高。针对这一不足,该文提出基于词向量空间模型的文本分类方法。其主要思想是把文本的特征词表示成空间向量,通过训练得到词-类别支持度矩阵,根据待分文本的词和词-类别支持度矩阵计算文本与类别的相似度。实验证明,这一分类方法取得了较高的分类精度和分类效率。
胡学钢董学春谢飞
关键词:文本分类向量空间模型
带通配符和One-Off条件的序列模式挖掘被引量:23
2013年
很多应用领域产生大量的序列数据.如何从这些序列数据中挖掘具有重要价值的模式,已成为序列模式挖掘研究的主要任务.研究这样一个问题:给定序列S、支持度阈值和间隔约束,从序列S中挖掘所有出现次数不小于给定支持度阈值的频繁序列模式,并且要求模式中任意两个相邻元素在序列中的出现位置满足用户定义的间隔约束.设计了一种有效的带有通配符的模式挖掘算法One-Off Mining,模式在序列中的出现满足One-Off条件,即模式的任意两次出现都不共享序列中同一位置的字符.在生物DNA序列上的实验结果表明,One-Off Mining比相关的序列模式挖掘算法具有更好的时间性能和完备性.
吴信东谢飞黄咏明胡学钢高隽
关键词:数据挖掘序列模式挖掘通配符
共4页<1234>
聚类工具0