徐家兴 作品数:5 被引量:8 H指数:2 供职机构: 郑州轻工业学院计算机与通信工程学院 更多>> 发文基金: 国家自然科学基金 更多>> 相关领域: 自动化与计算机技术 更多>>
面向聚类的堆叠降噪自动编码器的特征提取研究 被引量:2 2016年 为解决短文本聚类时文本的高维稀疏性问题,提出一种基于堆叠降噪自动编码器的短文本特征提取算法。该算法利用深度学习网络形式,把多个降噪自动编码器网络逐层堆叠起来,将高维、稀疏的短文本空间向量变换到新的低维、本质特征空间。实验结果表明,将提取的文本特征应用于短文本聚类,显著提高聚类的效果。 张素智 魏萍萍 徐家兴关键词:特征提取 聚类 面向空间多关键词的近似匹配查询算法 被引量:2 2017年 为解决以往空间位置查询中关键词文本描述信息较少、查询结果仅支持单个关键词查询等问题,在原有空间关键词查询基础上,提出一种支持空间多关键词的近似匹配查询SMQ(spatial multi-keywords query)算法。融入查询关键词集合和代价函数,支持空间多关键词查询;将近似匹配应用到空间多关键词算法中,提高查询关键词的容错率。将仿真结果与现有算法进行比较,比较结果表明,该算法能够返回更为精确的查询效果,在查询效率上有较大提高。 张素智 徐家兴 魏萍萍关键词:空间数据库 代价函数 基于改进PageRank算法的微博用户影响力排序研究 被引量:3 2016年 针对传统的PageRank算法中存在主题漂移和偏重旧网页的弊端,提出了一种基于改进PageRank算法的微博用户影响力排序方法——TSPR算法.该算法将时间因素作为横向标度,采用TF-IDF方法计算网页间的相似度,并具体分析某个时间段用户搜索主题相似度的变化.通过计算网页PR值的大小,从而对微博用户影响力进行排序.仿真实验结果表明,该算法改善了微博用户影响力排序效果,与此同时,提高了搜索质量和准确率. 丁温雪 徐家兴 朱颢东关键词:PAGERANK算法 基于位置服务上的信息发布/订阅数据建模研究 2016年 目前,基于内容、主题在线发布/订阅系统的数据建模和匹配算法缺乏面向LBS的支持,因此提出基于LBS服务的信息发布/订阅数据建模。在该建模中,用户只需要订阅感兴趣的信息,就能够在当前所在位置接收订阅信息,这有效地解决现有的发布/订阅系统中数据匹配的冗余和低精度的问题。通过仿真实验,将数据模型应用于城市信息发布平台系统中。测试结果表明,该模型提高准确度,减少数据冗余,适合大规模发布/订阅应用需求。 张素智 徐家兴 魏萍萍关键词:查询处理 索引 信息发布 支持多子串近似匹配的空间关键词查询算法 被引量:1 2016年 随着空间数据飞速增长,不仅POI(Point Of Interest)越来越密集,而且每个空间点的文本描述也越来越多,以往关键词近似查询算法中,不同长度的关键词需要不同的阈值相匹配,影响查询效率和查询结果.针对以上不足提出了支持空间多子串近似匹配的空间关键词查询算法,在该算法中不需要考虑阈值的改变,而是将编辑距离直接应用到索引结构中.通过真实数据进行实验,表明该算法在查询精准性和查询效率上都有较大的提高. 张素智 丁温雪 徐家兴关键词:空间数据库 查询算法