张金鹏
- 作品数:3 被引量:13H指数:1
- 供职机构:重庆理工大学计算机科学与工程学院更多>>
- 发文基金:重庆市教委科研基金国家自然科学基金重庆市自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于变系数词性空间权值定义的英文句子相似度算法研究被引量:1
- 2015年
- 对短文本中词项按词性进行切分构建词性向量,将词性向量中词项进行归并构建词性空间,首次提出对词性空间的权值进行动态定义。词项在词性空间中映射权值通过词项词频信息和Word Net语义词典得到,短文本之间相似度运算转换为各词性空间相似度协同运算。将改进的文本相似度算法运用于微软研究院释义语料库上,实验结果表明,改进的文本相似度算法使得文本相似度计算的准确率和稳定性有了较大的提高。
- 黄贤英张金鹏赵明军刘英涛
- 基于K-means聚类算法和信息熵的页面排序算法研究被引量:1
- 2013年
- 针对经典的PageRank算法存在的偏重历史网页、主题漂移、平分网页链接权重等缺陷,引入了向量空间模型和信息论中的信息熵,提出一种改进的PRKE算法。该算法用表征网页特征的关键词构成的向量来表示网页,用关键词在网页中所占的权重作为向量中各个分量的权值;对已存在的网页采用K-means聚类算法进行聚类,以信息熵的形式表征各个簇的权值,完成对网页的宏观排序;融入了时间因子和主题相关度等参数,完成对网页的微观排序。实验结果表明,改进的PRKE算法相对于经典的PageRank算法在首页命中率、检索准确性等方面获得了较大的提高。
- 黄贤英张金鹏陈微微
- 关键词:搜索引擎PAGERANK算法K-MEANS聚类算法信息熵页面排序
- 基于词项语义映射的短文本相似度算法被引量:11
- 2015年
- 针对HowNet语义词典对词项收录数量的有限性在一定程度上制约文本相似度运算准确性的问题,提出一种词项语义维度映射的方法。从词项词性的角度出发,按词性对短文本中词项进行切分,按词性特征对短文本之间进行词项归并,构建词性向量,依据词频和HowNet语义词典,词项完成词性向量中权值映射,将短文本之间相似度运算转换为词性向量之间相似度运算。将该算法运用于信箱测试数据集,实验结果表明,该算法提高了文本相似度运算的准确率和相似度平均值。
- 黄贤英张金鹏刘英涛赵明军