国家242信息安全计划(2005C48)
- 作品数:16 被引量:68H指数:5
- 相关作者:罗森林潘丽敏韩磊谢尔曼冯扬更多>>
- 相关机构:北京理工大学哈尔滨理工大学国家互联网应急中心更多>>
- 发文基金:国家242信息安全计划更多>>
- 相关领域:自动化与计算机技术电子电信更多>>
- 融合C4.5与SVM算法的汉语句义类型识别方法被引量:1
- 2012年
- 选择50个词法和句法特征,进行了大量特征筛选实验,并基于筛选后的特征组合提出了一种融合C4.5和SVM的句义类型识别方法.该方法充分利用C4.5对多重句义的高精度识别和SVM对简单句义、复杂句义的高精度识别的特点,将C4.5与SVM分别识别的结果进行融合处理.给出最终的句义类型识别结果.识别结果表明,在BFS-CTC汉语标注语料库中,选取了4 500个句子,经十折交叉验证,句义类型的识别准确率达到92.1%.
- 罗森林王倩刘莉莉韩磊
- 关键词:自然语言处理语义分析
- 基于MFCC和GMM的个性音乐推荐模型被引量:12
- 2009年
- 提出一种基于Mel频率倒谱系数(MFCC)和高斯混合模型(GMM)的个性音乐推荐模型的建立方法.该方法采用MFCC技术提取歌曲的语音特征,并利用GMM算法生成该歌曲的模板,然后利用音乐模板库对音乐文件进行相似度计算.实验结果表明,利用该模型为用户推荐的歌曲平均准确率为90%.
- 牛滨孔令志罗森林潘丽敏郭亮
- 关键词:MEL频率倒谱系数高斯混合模型
- 特定类型音频流泛化识别方法被引量:5
- 2011年
- 提出一种基于Mel频率倒谱系数(MFCC)和AdaBoost算法的特定类型音频流泛化识别方法,通过分析特定类型音频流的子类别间的共性和差异性,利用共性特征进行泛化识别,能够准确地检测并定位音频流中特定类型的音频.文中将枪声作为特定类型音频进行研究,通过提取各种枪声子类别的共性,弱化子类间的差异得到一个泛化的枪声模板,利用一个模板就可以支持多子类的准确识别.实验结果表明,算法的识别准确率为87.6%,查全率达到91.8%.
- 罗森林李金玉潘丽敏
- 关键词:音频检索ADABOOSTMEL频率倒谱系数
- 一种新的自适应镜头边界检测算法被引量:6
- 2010年
- 针对镜头边界检测中存在的检测效果和检测阈值依赖人工经验的问题,提出了一种新的自适应镜头边界检测算法.该算法以视频帧窗口中亮度帧差到帧差均值的距离作为切变检测特征,根据该距离值的变化程度自动选取切变最优化阈值;以视频帧序列中的颜色帧差为渐变检测特征,对该帧差进行数量级量化,直接利用量化结果判定渐变,实现了镜头检测的自适应.实验结果表明,该算法对切变的查准率和查全率分别为96.74%和97.41%,对渐变的查准率和查全率分别为92.34%和89.67%,对于不同类型的视频检测效果稳定.
- 冯扬罗森林王丽萍潘丽敏
- 关键词:镜头边界检测自适应检测
- 纯音乐与语音-音乐混合片段的高准确识别方法被引量:1
- 2009年
- 通过对同一首歌曲音频信号的特征分析,提出了一种基于音频片段平均短时能量和过0率标准偏差的融合判决方法.该方法解决了纯音乐与语音-音乐混合片段识别易混度高的问题,可以准确地识别同一首歌曲中纯音乐片段和语音-音乐混合片段,为去除音频中不需要的部分提供一种有效的预处理方法,并且可以更好地提高数据处理的效率和性能.实验结果表明,通过对不同风格、不同歌手以及不同语言的歌曲处理,纯音乐的平均正确率为92.30%,语音-音乐混合的平均正确率为96.36%.
- 孔令志罗森林张冰王耀威
- 2D-Haar声学特征超向量快速生成方法
- 2016年
- 针对大数据量音频的高速处理,提出一种快速的声学特征超向量生成方法,有效提高音频识别系统的识别速度和精度.所提方法首先将多个连续音频帧的常用声学特征构成声学特征图,进而使用低复杂度的运算方法在其中快速提取维数达数十万的Haar-like声学特征;然后使用AdaBoost.MH算法,筛选出具有较高代表性的Haarlike声学特征模式组合,用以构成声学特征超向量;进而提出Random AdaBoost特征筛选方法,进一步提高特征筛选速度.实验结果表明,在音频事件识别、说话人识别、说话人性别识别3种场合下,使用Haar-like声学特征可以使SVM、C5.0、AdaBoost等识别算法获得比MFCC、PLP、LPCC等常用声学特征更高的识别准确率,同时可以获得7~20倍的训练速度提升和5~10倍的识别速度提升.
- 谢尔曼罗森林潘丽敏
- 关键词:音频处理
- 高可靠In-VM隐藏进程对抗检测方法被引量:2
- 2018年
- 通过隐藏进程执行恶意代码是信息攻击的一种重要手段,目前虚拟化平台中In-VM隐藏进程检测方法还存在被绕过和相关数据被篡改的可能性,针对这一问题,提出了一种高可靠In-VM隐藏进程对抗检测方法.该方法利用In-VM模型,通过改进虚拟化内存保护机制保护隐藏进程检测代码及其相关内核数据,确保其不被恶意篡改;通过准确劫持系统调用函数,并结合交叉视图方法检测隐藏进程,确保隐藏进程的检测算法无法被绕过.实验选取并构建多种典型的Rootkit隐藏进程,结果表明,该方法可以检测各种Rootkit隐藏进程,其隐藏进程检测代码及其相关数据无法被恶意篡改,检测算法和内存保护机制无法被绕过,而且改进的虚拟化内存保护机制对系统的性能影响更小,方法的可靠性高,实用价值大.
- 闫广禄罗森林刘望桐潘丽敏
- 关键词:虚拟化ROOTKIT
- 基于相似度匹配的网络协议语法分析方法
- 2016年
- 为解决网络协议语法分析方法中,依赖人工干预、分析效率低下、分析范围较小等问题,提出一种基于相似度匹配的网络协议语法分析方法.通过嗅探采集网络原始数据包,解析基础协议并对数据包进行预处理,提取9维不同角度的特征,建立了网络协议语法相似分析模型,分析网络协议细节语法特征.通过将TCP协议作为已知协议,对UDP、DNS、QQ等3种不同类型的协议测试,结果表明这3类协议报头中,33%以上的字段能在TCP协议中找到对应的相似语法,而且平均准确率均在96%以上,该方法不需人工干预,可以提高分析效率、减少限制条件、扩大分析范围,并能较为有效地分析出网络协议语法特征.
- 郭亮罗森林潘丽敏
- 关键词:相似度匹配
- 融合句义结构模型的短文本推荐算法研究被引量:1
- 2015年
- 传统的基于协同过滤的推荐系统需要收集用户兴趣喜好等相关数据,在一定程度上涉及到用户的个人隐私,当前信息安全和隐私保护是数据挖掘领域的热点之一,为了有效避免用户信息泄露带来的安全问题,提出一种融合句义结构模型的短文本推荐方法。该方法以句子为研究对象,首先利用LDA主题模型构建文章-主题矩阵,划分子主题,然后利用句义结构模型抽取句子的语义格得到句子的语义特征,基于LDA主题模型使用句义结构计算句子两两之间的语义相似度,构建相似度矩阵,融合句子的语义特征和关联特征综合加权得到句子权值,以文章内最高单句权值衡量文章权值,将文章权值统一进行排序,按照排序顺序去冗余后依次推荐。在压缩比为0.5%的条件下,ROUGE-1值达到31.388%,ROUGE-SU*达到15.701%.实验结果表明,以句子为粒度的短文本推荐算法能丰富文本的特征信息、深化语义分析层次,在数据处理过程中未收集用户信息,从而有效避免用户信息泄露等安全问题,实现更加安全、快速向用户推荐文本。
- 原玉娇罗森林林萌潘丽敏
- 关键词:主题模型自然语言处理信息安全
- 融合GMM及SVM的特定音频事件高精度识别方法被引量:5
- 2014年
- 针对特定音频事件识别中持续时间特别短的音频事件漏检概率高、识别速度较慢的问题,提出一种融合高斯混合模型(GMM)及支持向量机(SVM)的特定音频事件识别算法.该方法利用GMM的统计分布描述能力和SVM的推广泛化能力,将GMM和SVM分别识别的结果进行融合处理,以手枪、步枪、机关枪等10类以上枪声为实验数据,无需针对每种枪声生成相应的识别模板,仅需训练生成2个识别模板.实验结果表明,识别准确率达到92.71%.该方法模板数量少,不需要多次训练,算法复杂度较低,不仅便于应用而且可大幅提升识别效率.
- 罗森林王坤谢尔曼潘丽敏李金玉