您的位置: 专家智库 > >

江苏省自然科学基金(BK2011204)

作品数:6 被引量:65H指数:3
相关作者:董永权王琛梁银张功杰胡局新更多>>
相关机构:江苏师范大学江苏建筑职业技术学院徐州工程学院更多>>
发文基金:江苏省自然科学基金国家自然科学基金江苏省高校自然科学研究项目更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 6篇中文期刊文章

领域

  • 6篇自动化与计算...

主题

  • 2篇文本聚类
  • 2篇聚类
  • 2篇均值聚类
  • 2篇关键词
  • 2篇关键词查询
  • 2篇K均值
  • 2篇K均值聚类
  • 2篇查询
  • 1篇代价函数
  • 1篇信息抽取
  • 1篇语义标注
  • 1篇整数线性规划
  • 1篇矢量
  • 1篇矢量空间模型
  • 1篇数据集
  • 1篇数据集成
  • 1篇数据聚类
  • 1篇数据库
  • 1篇随机场
  • 1篇条件随机场

机构

  • 5篇江苏师范大学
  • 2篇江苏建筑职业...
  • 1篇山东大学
  • 1篇徐州工程学院
  • 1篇徐州师范大学

作者

  • 5篇董永权
  • 2篇梁银
  • 2篇王琛
  • 1篇彭朝晖
  • 1篇李庆忠
  • 1篇胡局新
  • 1篇丁艳辉
  • 1篇张功杰

传媒

  • 2篇计算机工程与...
  • 1篇科技通报
  • 1篇计算机研究与...
  • 1篇计算机应用
  • 1篇计算机工程与...

年份

  • 2篇2021
  • 1篇2015
  • 1篇2014
  • 1篇2013
  • 1篇2012
6 条 记 录,以下是 1-6
排序方式:
最优有序路径关键词查询
2015年
为了实现最优有序路径关键词查询,提出了基于动态阈值的OSRK迭代算法,通过不断缩小阈值来过滤不可能出现在最优有序路径中的空间对象,同时在迭代添加路径时,删除不包含给定关键词的空间对象,能够有效地减少候选空间数据集的大小,提高查询响应性能。通过实验验证了算法的有效性。
梁银董永权
关键词:关键词查询
基于约束条件随机场的Web数据语义标注被引量:9
2012年
Web数据语义标注是Web信息抽取中的关键步骤.条件随机场是利用序列特征处理序列标注问题的经典方法.然而现有条件随机场模型无法综合利用已有的Web数据库信息和Web数据元素之间的逻辑关系,导致Web数据语义标注准确率不高.因此,提出一种约束条件随机场模型(CCRF).该模型通过引入可信约束和逻辑约束,有效利用了已有的Web数据库信息和Web数据元素之间的逻辑关系.为了克服现有条件随机场模型Viterbi推理方法无法综合利用这2类约束的不足,该模型采用整数线性规划推理方法,将两类约束同时引入推理过程.通过在多个领域的真实数据集上的实验结果表明,所提出的模型能够显著提高Web数据语义标注的性能,并且为Web信息抽取奠定了良好的基础.
董永权李庆忠丁艳辉彭朝晖
关键词:语义标注WEB信息抽取条件随机场整数线性规划WEB数据集成
融合化学反应优化与K均值的文本数据聚类
2021年
提出一种融合化学反应优化与K均值的文本聚类算法。结合K均值聚类的局部快速开发寻优能力和化学反应优化的全局勘探能力,以K均值聚类解集合作为化学反应优化的初始分子结构群,通过引入单分子碰撞、单分子分解、分子间碰撞和分子间合成4种化学反应操作,增加种群分子多样性;利用融合余弦相似度和欧氏距离的适应度函数评估分子优劣,在扩展搜索空间的基础上求解最优文本聚类。聚类测试结果表明,在多数数据集上,算法在适应度、准确率、精确率、召回率和F度量等指标上均表现更好。
王琛董永权
关键词:文本聚类K均值聚类矢量空间模型
基于对象集合的空间关键词查询
2014年
在进行空间关键词查询时,有时需要查找一组既紧凑且离查询点最近、又覆盖查询关键词且对象个数很少的对象,而现有的查询方法通常只能返回包含所有查询关键词的单个空间对象。为此,提出了解决此类查询问题的近似查询算法和精确查询算法。首先给出了这类查询问题的形式化定义,以及描述对象集合质量的代价函数,并对代价函数进行了归一化处理;然后在近似查询算法中采用基于IR-tree的最佳优先搜索策略进行剪枝,有效缩减了查询候选空间;在精确查询算法中采用基于IR-tree的广度优先搜索策略查找包含查询关键词的对象,以达到降低查询处理代价的目的。实验结果表明,近似算法的查询效率明显优于精确算法,且能获得非常精确的查询结果。
梁银董永权
关键词:空间数据库代价函数
基于K折交叉验证的选择性集成分类算法被引量:51
2013年
针对传统选择性集成方法确定个体分类器权重参数不准确、计算复杂度较高的不足,提出了一种基于K折交叉验证的选择性集成分类算法。该算法首先采用集成学习思想训练一定数目的分类器,然后对每一个分类器设定权重参数初值,并利用交叉验证思想确定对应最大平均分类准确率的参数作为最终的个体分类器的权重因子,最后将权重小于某个预设阈值的分类器剔除,完成选择性集成学习。由于交叉验证方法可以较快并且较为精确地进行权重参数的确定,所以本算法可以有效地提高选择性集成方法的分类性能。在UCI标准数据集上的仿真实验充分证明了本算法的有效性。
胡局新张功杰
关键词:分类器
基于二进制灰狼优化的特征选择及文本聚类被引量:5
2021年
提出基于二进制灰狼优化的特征选择与文本聚类算法。为得到最佳聚类结果,将文本数据表达为矢量空间模型;利用二进制灰狼优化算法对文本特征进行选择,得到初选特征子集;对前一阶段中不同特征相关分值计算方法得到的初选特征子集进行合并与交叉操作,进一步计算最优特征子集;在新特征子集基础上,利用同步考虑余弦相似度和欧氏距离指标的多目标优化K均值算法完成文本聚类,得到最优文本聚类解。实验结果表明,在多数数据集上,该算法可以有效降低特征维度,聚类指标表现更好。
王琛董永权
关键词:文本聚类K均值聚类
共1页<1>
聚类工具0