您的位置: 专家智库 > >

教育部人文社会科学研究基金(12YJC870001)

作品数:7 被引量:90H指数:5
相关作者:白如江王效岳杨京刘自强祝娜更多>>
相关机构:山东理工大学更多>>
发文基金:教育部人文社会科学研究基金文化部科技创新项目国家社会科学基金更多>>
相关领域:文化科学自动化与计算机技术更多>>

文献类型

  • 7篇中文期刊文章

领域

  • 6篇文化科学
  • 3篇自动化与计算...

主题

  • 2篇关键词
  • 2篇查询
  • 2篇长句
  • 1篇单篇
  • 1篇多维度
  • 1篇学术
  • 1篇学术论文
  • 1篇学术论文评价
  • 1篇影响因素
  • 1篇语义
  • 1篇语义角色
  • 1篇语义角色标注
  • 1篇支持向量
  • 1篇支持向量机
  • 1篇日志
  • 1篇色标
  • 1篇时间序列
  • 1篇时间序列模型
  • 1篇实证
  • 1篇实证研究

机构

  • 7篇山东理工大学

作者

  • 7篇王效岳
  • 7篇白如江
  • 2篇祝娜
  • 2篇刘自强
  • 2篇杨振瑜
  • 2篇杨京

传媒

  • 5篇情报理论与实...
  • 1篇图书情报工作
  • 1篇情报学报

年份

  • 1篇2017
  • 2篇2016
  • 2篇2015
  • 1篇2014
  • 1篇2013
7 条 记 录,以下是 1-7
排序方式:
基于KeyGraph关键词抽取的长句查询扩展技术研究被引量:1
2014年
文章利用KeyGraph算法来对搜索引擎中的长句查询进行处理,抽取其中的关键主题,然后再在KL-divergency、BM25、TFIDF三种不同的检索模型上分别进行实验。研究发现经过KeyGraph关键词抽取技术处理过的长句查询检索效果得到了明显提高,并且在KL-divergency语言模型上的检索效果最好,有效地提高了长句查询的准确率和相关文档的排序。
白如江杨振瑜王效岳
关键词:关键词
多维主题演化分析模型构建与实证研究被引量:14
2017年
[目的/意义]分析科研主题的复杂演化过程,能够帮助学者及时把握研究热点、研究前沿和发展趋势,然而目前主题演化相关研究主要从单一维度进行演化分析。[方法/过程]文章构建了基于主题热度、状态和演化路径3个维度的主题演化分析模型,以碳纳米管研究领域为例进行了实证研究,首先对相关科技文献数据进行采集、预处理,并利用PLDA模型进行主题识别,然后基于多维主题演化分析模型,结合可视化技术,构建了多个维度的科学知识图谱,分析了主题热度、演化状态、宏观演化脉络和微观演化路径,清晰地描绘了碳纳米管领域的主题演化脉络、趋势。[结果/结论]研究结果表明,多维主题演化分析模型能够准确分析主题演化生命周期的复杂过程。
刘自强王效岳白如江
关键词:多维度主题识别可视化实证研究
单篇学术论文评价研究现状与发展趋势被引量:26
2015年
学术论文作为科学研究的主要成果形式之一,如何有效评价学术论文的学术水平和影响力一直是文献计量学领域的研究重点。文章在分析学术论文评价外在与内在影响因素的基础之上,梳理了目前国内外主要的学术论文评价方法,包括基于外在引用指标分析方法、基于网络分析方法、同行评议方法、替代计量学方法、基于论文内容评价方法、综合评价方法。最后,指出了学术论文评价方法的未来发展趋势。
白如江杨京王效岳
关键词:学术论文影响因素
语义增强的科技创新内容表征研究被引量:6
2016年
[目的/意义]随着计算机信息处理技术以及文本数据挖掘技术的发展,研究人员开始利用语义分析技术深入分析科技文献文本数据,识别出科技文献中的科技创新内容,以期为科技创新和科技决策提供支持和帮助。[方法/过程]文章通过分析科技创新内容结构分布特征,以句子为最小标引粒度,利用Keygraph算法抽取出科技文献摘要中的关键词进行科技创新内容特征选择,基于SVM的语义角色标注技术完成科技创新内容的语义表征。[结果/结论]实验结果表明,语义增强的科技创新表征方法可以基本实现科技创新内容的语义标引。
白如江祝娜王效岳
关键词:支持向量机
基于LDA的科技创新主题语义识别研究被引量:18
2015年
[目的 /意义]由于传统科技创新主题概率识别方法忽略文本内容语义理解,为了更加准确地识别出主题,科技创新主题语义识别势在必行。[方法 /过程]提出一种基于LDA的科技创新主题语义识别方法,利用语义角色标注技术对科技文献中的科技创新内容进行语义标引,构建LDA主题语义识别模型,根据表征科技创新内容的关键词语义角色对应的上位词的概率识别出科技创新主题。[结果 /结论]通过以3D打印领域数据为对象进行实验,证明该方法能够更加准确地识别出科技创新主题,形成科技创新主题-主题词-科技文献的混合分布聚类集群,减少研究背景等无关数据干扰,避免语义含义相同的科技创新主题词重复统计问题。
祝娜王效岳杨京白如江
关键词:LDA模型3D打印
基于时间序列模型的研究热点分析预测方法研究被引量:27
2016年
文章提出一种基于时间序列模型的研究热点评价与预测方法。利用关键词词频排序、热点关键词群构建和时间序列模型分析等方法,对CNKI收录的以竞争情报为关键词的近10年期刊论文的关键词进行处理,分析梳理了近10年竞争情报领域的研究现状,运用关键词群分析、社会网络分析和时间序列模型分析预测其研究热点的发展趋势。最后将2015年作为预测目标进行预测,将预测结果与实际数据对比,实验结果证明该方法是可行有效的。
刘自强王效岳白如江
关键词:时间序列模型关键词
基于大规模搜索日志的中文长句查询分析研究被引量:2
2013年
本文利用大规模搜索日志对用户中文长句查询的情况进行了统计研究。通过分析搜索日志中的中文长句查询确定了经常发生的查询类型特点,并对用户搜索行为与查询长度、查询类型和查询频率的关系进行了研究。进一步了解了session中用户查询词修改情况,总结了用户查询修改方法和长度修改方面的特征和规律。最后,将不同长度的查询放到了三个商业搜索引擎中分别进行检索,计算其重叠率。通过以上的分析研究发现虽然目前大部分查询都是短查询,但短查询并不能满足用户所有的检索需求,特别是在搜索引擎向语义检索不断发展的今天,长句检索的分析和利用能够从更深层次上了解用户的查询用语特点和搜索点击行为,这对于查询技术的改进和语义空间的构建都具有积极的作用。
白如江杨振瑜王效岳
关键词:SESSION
共1页<1>
聚类工具0