易军凯
- 作品数:53 被引量:123H指数:5
- 供职机构:北京化工大学信息科学与技术学院更多>>
- 发文基金:国家科技支撑计划青年科技基金中央高校基本科研业务费专项资金更多>>
- 相关领域:自动化与计算机技术理学自然科学总论历史地理更多>>
- 基于距离的相似最近邻搜索算法研究被引量:2
- 2017年
- 为了提高相似最近邻搜索(ANN)算法的精度,提出了一种在度量空间下基于距离的相似最近邻搜索算法—优化的VP森林(OVF)算法。在传统VP树(VT)算法的基础上,首先采用改进的选择优势点的方法,通过从数据集采样优势点候选集,对其进行评估,选取其中区分度大的点作为优势点;然后提出构建多棵VP树的新方法,改进距离优势点远的子树中最近邻不紧凑问题;接着提出使用优先队列与剪枝搜索方法结合的新搜索方法查找最近邻,减少了很多不必要的距离计算。最后通过实验结果表明,本文方法在数据维度、数据集大小、返回不同邻居个数、不同的距离函数及建树个数方面精度有了很大的提高。
- 姜大光孙贺娟易军凯
- 关键词:剪枝方法
- 图像的SIFT特征二阶检索算法
- 2016年
- 提出了用图像SIFT特征二阶检索算法实现相似图像检索。首先对图像进行SIFT特征提取,然后利用词袋算法通过K-Means聚类出特征词并建立特征词频表,最后基于词频表通过二阶检索算法实现相似图像匹配。二阶检索分两步:第一步实现特征分布结构的相似检索;第二步根据两张图像对应特征点落于同一特征类的数量与图像自身特征点数的比例来实现图像的精确检索,提高图像检索的准确率。实验结果表明,该方法具有较高的查全率,同时在查询效率上也具有很好的表现。
- 易军凯陈龙龙姜大光
- 关键词:SIFT特征图像检索
- Web应用服务器OnceAs的实现与测试被引量:1
- 2007年
- OnceAs是网驰(ONCE)软件基础平台的一个核心部分,基于J2EE1.3规范进行设计和开发,实现J2EE规范中约定的接口和服务,目前OnceAs提供标准版和集群版两个版本,可运行于多个异构操作系统,支持多种数据库管理系统。OnceAs已通过SUN JPS的所有功能测试,并在高端的PC机或低端的服务器上就可以达到J2EE应用服务器性能测试基准ECperf所要求的各项性能指标。本文介绍OnceAs的系统结构,各主要功能模块、服务和工具的实现方式,并通过Ecperf测试描述了OnceAs的各项主要性能。
- 林珂珉易军凯范国闯
- 关键词:WEB应用服务器J2EE
- P2P内容搜索的信息相似值计算方法被引量:4
- 2011年
- 随着P2P网络的迅速发展,其用户数量不断增加,信息交互也越发频繁。为了降低内容搜索的复杂度和搜索时间,提出了一种以信息相似值为依据的计算方法。这种计算方法将无规则P2P网络中的节点按照节点的信息相似值划分为不同的域。在信息搜索时,将搜索的关键字与域头节点信息向量进行匹配,算法将整网搜索转化成域内或相邻域搜索,并根据用户兴趣值返回搜索结果。实验证明,这种信息相似值的计算方法在降低搜索时间的基础上,有较高的搜索命中率和查询准确率。
- 易军凯张雅聪孙建伟
- 关键词:P2P搜索
- 面向文本分类的深度置信网络特征提取方法研究被引量:5
- 2018年
- 在对文本分类领域发展现状进行研究的基础上,提出了一种面向文本分类的深度置信网络特征提取方法,通过引入词向量模型和深度置信网络解决传统文本分类方法在文本表示及特征提取方面存在的语义缺失问题,实验结果表明,该方法在文本分类中有更高的准确率。
- 易军凯王超李辉
- 关键词:文本分类特征提取
- 基于信息熵的二次聚类推荐算法被引量:3
- 2016年
- 用户对网页文本缺少主动评价信息会影响最终推荐结果的准确程度。为此,提出一种新的二次聚类推荐算法,通过对用户所浏览过的网页文本特征词的提取及相关权重的计算,得出每一个网页的文本信息熵值与最邻近熵差。利用连续型随机变量的均匀分布计算得到最邻近熵差阈值,借助平均熵值逼近确定二次聚类初始聚类簇数和簇心,结合对数函数拟合的方法计算推荐数量,通过2次文本聚类,运用欧氏距离和信息熵值确定推荐内容。实验结果表明,该推荐算法在实际系统中运行稳定,与单纯只进行2次聚类运算的推荐算法相比,推荐准确程度有所提高。
- 李辉石钊易军凯
- 基于OpenCV的人脸识别方法
- 本文结合隐马尔可夫模型提出了基于OpenCV的人脸识别方法.从隐马尔可夫模型出发,建立了用于人脸识别的特征训练模型,提出了用OpenCV开发人脸识别程序的一般步骤,包括加载分类器、预处理图像、人脸检测和人脸识别.讨论了O...
- 万静赵栋易军凯
- 关键词:OPENCV人脸识别隐马尔可夫模型
- 文献传递
- 深度词汇网络学习的文本聚类研究
- 2015年
- 为改进已有中文文本聚类中数据非结构化导致的算法准确度不高及特征向量高维稀疏导致算法复杂度过高的现状,提出一种基于深度词汇网络学习的中文文本聚类算法,解决了优化数据非结构化带来的聚类结果准确性低及特征向量高维度带来的高复杂度问题。首先建立词汇网络用以抽取关键义原,以词语义原代替单词作为网络节点,不仅避免了语义消歧,同时考虑到词语间语义相似性与词汇相关性,使所提取的特征向量更能表现出文章的主旨,提高聚类效果;另一方面,训练深度学习网络对特征向量降维处理,在降维的同时保留尽可能多的信息,大大减低算法的执行时间。聚类质量检测方法(F-measure)的结果表明,本文算法比k-means算法在中文文本聚类中有更好的表现。
- 易军凯冯佳明万静
- 关键词:词汇网络中文文本聚类
- 基于类别区分度的文本特征选择算法研究被引量:4
- 2013年
- 针对词频反文档频率(TFIDF)算法的缺陷,引入类别区分度理论改进传统的TFIDF算法。通过比较改进TFIDF算法与其他几种常用特征选择算法的分类效果,证明了改进TFIDF算法用于中文文本分类时,准确率和召回率要优于其他算法,改进TFIDF算法具有较好的特征选择效果。
- 易军凯田立康
- 关键词:文本分类
- 基于光栅效应的信息隐藏技术研究被引量:1
- 2015年
- 为将印刷防伪中的莫尔效应应用于信息隐藏领域,本文提出一种新的信息隐藏框架,解决了将原有技术直接引入信息隐藏领域所产生的诸多问题。首先,直接引入可以隐藏信息并产生莫尔效应的周期性光栅,摆脱原有技术依附于印刷过程中的加网操作的限制;其次将已处理为轮廓矩阵的指定隐藏信息按照一定方法隐藏于母版图片中,实现周期直线光栅信息隐藏功能;同时增加光栅参数,引入曲线光栅,增加隐藏信息破解成本,提高信息安全性。
- 易军凯赵向凯
- 关键词:信息隐藏