您的位置: 专家智库 > >

王成勇

作品数:2 被引量:1H指数:1
供职机构:南京航空航天大学计算机科学与技术学院更多>>
发文基金:国家自然科学基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 2篇中文期刊文章

领域

  • 2篇自动化与计算...

主题

  • 2篇文档
  • 2篇XML文档
  • 1篇偏好
  • 1篇文档相似度
  • 1篇相似度
  • 1篇聚类
  • 1篇聚类算法
  • 1篇XML

机构

  • 2篇南京航空航天...

作者

  • 2篇孙静
  • 2篇杜庆伟
  • 2篇孙振
  • 2篇王成勇

传媒

  • 1篇计算机工程与...
  • 1篇计算机与现代...

年份

  • 1篇2016
  • 1篇2015
2 条 记 录,以下是 1-2
排序方式:
用带权重的pq-gram算法计算XML文档相似度被引量:1
2015年
XML文档聚类是高效管理XML文档的重要手段,XML文档相似度计算正是其中的关键步骤。pq-gram算法是解决XML文档相似度计算问题的有效手段,但忽略了XML文档结点的有序性。带权重的pq-gram算法是在此基础上,依据XML文档的结构性,首先为结点赋予相应权重,然后基于结点的权重对pq-gram赋予权重,最后将设定的权重应用到XML文档相似度计算中。实验结果表明,带权重的pq-gram算法更好地描述结点在XML文档相似度计算中的贡献度,提高了XML文档相似度计算的精度。
王成勇杜庆伟孙静孙振
关键词:XML文档
基于特征偏好的XML文档聚类算法
2016年
XML文档聚类在众多数据应用领域都具有重要作用。基于特征偏好的XML文档聚类算法是对XML文档进行特征选择,将XML文档描述为n维特征向量,再结合CFP(Clustering with Feature order Preference)算法,根据特征偏好为其赋予权重,每次迭代聚类过程中进行权重的更新。实验结果表明当CFP算法中的特征偏好权重和XML文档向量化时所用的层次权重设定相结合时,可弥补XML文档向量化时的弊端,提高了XML文档聚类的精度。
王成勇杜庆伟孙静孙振
共1页<1>
聚类工具0