张翔
- 作品数:39 被引量:218H指数:8
- 供职机构:西安建筑科技大学信息与控制工程学院更多>>
- 发文基金:国家自然科学基金陕西省自然科学基金陕西省教育厅科研计划项目更多>>
- 相关领域:自动化与计算机技术文化科学矿业工程动力工程及工程热物理更多>>
- Bagging算法在中文文本分类中的应用被引量:12
- 2009年
- Bagging算法是目前一种流行的集成学习算法,采用一种改进的Bagging算法Attribute Bagging作为分类算法,通过属性重取样获取多个训练集,以kNN为弱分类器设计一种中文文本分类器。实验结果表明Attribute Bagging算法较Bagging算法有更好的分类精度。
- 张翔周明全耿国华侯凡
- 关键词:ATTRIBUTEBAGGINGBAGGING中文文本分类K-近邻
- 基于LSVM算法的人脸识别方法研究被引量:2
- 2008年
- 对于人脸识别的关键技术进行了深入研究。提出了一种PCA(Principal Component Analysis)和LSVM(Lagrangian Support Vector Machine)相结合的人脸识别方法。首先使用PCA算法对人脸图像进行特征提取和降维处理,然后设计了一种比传统SVM更易于实现而且效率更高的LSVM算法分类器,最后针对ORL人脸图像库的识别结果表明,该方法的识别率比自联想神经网络高。
- 张翔周明全耿国华王晓凤
- 关键词:LSVM降维人脸识别
- 基于深度学习的大规模语义文本重叠区域检索被引量:5
- 2021年
- 针对传统文本重叠区域检索方法存在精确性和查全性差的问题,提出了基于深度学习的大规模语义文本重叠区域检索方法。结合稀疏自动编码器与深度置信网络构建了混合模型,依据混合模型设计并构建了文本分类器,该分类器主要组成部分为文本预处理、特征学习、分类检索。针对文本集合中文本实行去噪、分词和去停止词等一系列预处理。最后,采用Softmax回归实现文本分类,将学习得到的文本特征当作分类器的输入得到文本重叠区域分类检索结果。经实验验证可知:该方法查准率与查全率均较高,表现出了可靠性与鲁棒性。
- 董丽丽杨丹张翔
- 一种分布式中文微博热点话题的发现方法
- 2014年
- 针对微博数据文本内容短小、特征词稀疏以及规模庞大的特点,提出了一种基于Map Reduce编程模型的发现微博热点话题的方法。该方法首先利用隐主题分析技术解决了微博内容短小、特征词稀疏的问题,然后利用CURE算法缓解了Kmeans算法对初始点敏感的问题,最后采用基于Map Reduce编程模型Kmeans聚类算法,对海量微博短文本数据进行快速聚类。实验结果表明该方法可以有效提高微博热点话题发现的效率。
- 张翔吝睿涛
- 关键词:MAPREDUCE聚类
- 基于时空残差网络的区域客流量预测方法被引量:2
- 2020年
- 针对区域客流量波动性强、复杂非线性的特征,易受到季节性影响,并且单一神经网络模型无法同时学习时间与空间相关性问题,通过对区域客流量影响因素分析,结合残差网络和全连接网络,提出了用于区域客流量预测的改进Quad-ResNet模型;Quad-ResNet模型融合了4个残差网络和一个全连接网络,该模型通过深层次的卷积学习空间相关性,结合4个残差网络学习时间邻近性、相似性、周期性、趋势性,使用全连接网络学习季节性影响;将Quad-ResNet模型与LSTM、CNN、STResNet模型在同一数据集上进行区域客流量预测对比实验,实验结果表明,Quad-ResNet模型误差小于其他对比模型,而且在训练和预测的操作上明显比LSTM模型更简便,更适用于区域客流量预测。
- 董丽丽柳佳欢费城张翔
- 面向中文文本分类的C4.5Bagging算法研究被引量:4
- 2009年
- 对于中文文本分类问题,提出一种新的Bagging方法。这一方法以决策树C4.5算法为弱分类器,通过实例重取样获取多个训练集,将其结果按照投票规则进行合成,最终得到分类结果。实验证明,这种算法的准确率、查全率、F1值比C4.5、kNN和朴素贝叶斯分类器都高,具有更加优良的性能。
- 张翔周明全耿国华侯凡
- 关键词:BAGGING算法C4.5算法中文文本分类
- 一种结合矩阵分解和深度学习技术的POI推荐模型
- 2020年
- 基于位置社交网络(LBSN)的兴趣点(POI)推荐算法是近年来的研究热点,有效的POI推荐具有极大的经济和社会效益;针对LBSN中的数据稀疏问题、用户细粒度兴趣(即用户的长期和短期兴趣)序列建模问题和联合多种影响因素的POI推荐问题,研究一种结合矩阵分解和带有注意力机制深度学习技术的POI推荐模型(CF-ADNN);一方面,构造特征矩阵缓解签到数据稀疏问题,通过矩阵分解得到隐藏因子,计算POI的特征向量;另一方面,构建一种带注意力机制的用户细粒度兴趣的序列建模方式,有效学习用户长期和短期的兴趣特征,提高POI推荐精确度;结合上述两种方法,最终得到可以融合多种影响因素的POI推荐模型;并通过对比试验,进一步验证模型的推荐效果。
- 董丽丽秦蕾张翔
- 关键词:矩阵分解
- 利用CUDA提高内存数据聚类效能的研究
- 2015年
- 提出一种新的聚类算法AIK-Means,利用CUDA技术加速算法执行效率,并优化内存方法,可在有限时间内进行多次聚类;将Chameleon层次聚类算法用于解决K-Means算法的初始聚类中心敏感问题;在多次聚类结果中用FP-Tree进行关联分析,提高聚类有效性。将算法应用到某集团心理学MMPI数据测试,实验结果表明AIK-Means算法在执行效率和聚类有效性上具有良好的效果。
- 董丽丽董玮张翔
- 利用分级分段技术解决破碎刚体拼接问题
- 2009年
- 对计算机辅助文物复原的关键技术进行研究,结合青铜器的特点,提出利用分级分段技术解决破碎青铜器拼接问题的算法。该方法主要是分两级采样,第一级根据曲线的曲率变化进行特征点进行采样,第二级为在各个特征点之间使用精细采样。匹配的时候先使用第一级采样进行匹配计算,如果匹配合适再进行第二级匹配计算。在进行匹配计算时,使用分段的方法进行匹配,匹配计算后再使用分段进行验证,提高匹配的正确率,同时采用分级的技术可以提高计算速度。
- 高胜杰周明全耿国华张翔
- 基于粗糙集的中文文本特征选择方法研究被引量:4
- 2010年
- 针对传统的特征选择使用阈值过滤导致有效信息丢失的问题,提出一种粗糙集的文本特征选择方法。该方法以核为起点利用特征属性的重要性和依赖性作为启发式信息进行特征选择,使文本的特征维数得到一定程度的降低。实验表明,此算法不仅易于实现而且能够有效降低特征数目,提高分类效率。
- 张翔周明全耿国华
- 关键词:粗糙集