夏红科 作品数:25 被引量:93 H指数:6 供职机构: 北京信息科技大学计算机学院 更多>> 发文基金: 国家自然科学基金 国家社会科学基金 国家高技术研究发展计划 更多>> 相关领域: 自动化与计算机技术 文化科学 理学 更多>>
基于LSTM的金融新闻倾向性 被引量:4 2018年 为尽早发现负面新闻以降低对公司的影响,提出采用判断新闻文本关键句群倾向性的方法判断新闻的倾向性。对于公司名识别,在综合原有方法优势的基础上增加百度百科查询,向公司名基础词典加入公司名和公司代码映射;在关键句群抽取环节中,使用doc2vec模型计算句子和新闻标题相似度,综合句子位置信息、句子中领域动词信息、句子中公司名信息;使用Word2vec模型并结合TFIDF的句子表示方法,使句子的表示更加准确、更有侧重。使用LSTM模型对关键句群进行分类,实验结果表明,该模型分类效果优于传统机器学习分类模型和CNN。 郑国伟 吕学强 夏红科 周建设关键词:句子相似度 基于改进BP神经网络的学术活动文本分类 被引量:5 2018年 网站已成为高校发布学术活动通知的主要平台,能否从中准确抽取相关信息并进行分类,直接影响着办公自动化的效率。为了实现文本分类,采用向量空间模型(VSM)描述文本,利用一种改进的TF-IDF算法设置文本向量特征权重,并通过优化的互信息算法来实现文本特征提取与降维,改善了分类模型的向量输入。最后在构造BP神经网络文本分类器时,通过激活函数的选择、参数的初始值设置以及动量因子的引入对其进行改进。实验结果表明,改进后的方法在分类精度上有明显的提高,利用该方法可以较好地进行学术活动的文本分类。 田欢 李红莲 吕学强 周建设 夏红科关键词:文本分类 特征提取 BP神经网络 异构分布的多元线性回归隐私保护模型 被引量:11 2011年 隐私保护是数据挖掘领域中一个极其重要而富有挑战性的课题,以实现隐私数据的保护和准确知识的挖掘两者兼得为其最终目标.统计回归是数据挖掘的常用工具之一,而数据分布式存储情况下统计分析的研究工作甚少.由于机密性或其他原因,数据拥有者往往不情愿与其他合作方分享原始数据,去又希望与其他合作方共同协作执行统计分析.关注于如何解决既获取准确统计分析结果又保护原始数据隐私的平衡问题,基于环同态和离散对数计算困难的思想,建立了隐私保护回归模型,该模型通过同态公钥加密协议的同态性质从而获取准确的统计分析结果.经理论分析和实验证明该协议模型在语义上是安全的和有效的. 方炜炜 任江 夏红科关键词:安全多方计算 隐私保护 同态加密 密码学 移动社交网中基于兴趣社区的消息传输方案 被引量:1 2018年 节点对路由消息的存储-携带-转发是移动社交网中的一种短距离通讯方式,传输性能是影响用户交互体验的关键因素,如果用户能够根据彼此间的兴趣或社区来进行消息传输,则可提高传输性能。目前,针对移动社交网中的短距离通讯,已有的研究主要是基于兴趣或者基于社区的传输方式。为了使用户得到更好的交互体验,将用户兴趣与社区相结合,提出基于兴趣社区的消息传输方案InComT(Interest Community based Transmission)。对移动社交网中单个节点的兴趣进行度量,根据得出的节点兴趣值进行社区划分,从而确定社区整体的兴趣值,并根据兴趣值来选择中继社区和中继节点,实现消息的传输。仿真结果表明,该策略在传输负载率和平均延时较低的情况下能够拥有较高的传输成功率。 侯林清 蔡英 范艳芳 夏红科云存储中高效密文检索的中文数据加密方案 被引量:10 2018年 数据加密是确保云存储数据安全的主要技术,高效的密文检索技术对于提高密文检索效率和减小存储开销起到了决定性作用。大多数已有的基于密文检索的中文数据加密方案需要上传密钥,增加了密钥泄漏的风险。在密文检索过程中,对于关键字的匹配,一些方案需要多次对密文解密,严重降低了密文检索的效率;另一些方案构建了大量的索引文件,浪费了云存储空间。文中提出了一种能兼顾检索效率和存储开销的中文数据加密方案,其在数据加密阶段利用了数据分块随机排序和标号向量加密技术,在密文检索阶段配合构建的索引向量文件对密文进行类明文检索。在整个过程中不需要将密钥上传至云服务器,建立索引向量文件所消耗的存储空间也小于其他基于索引的方案。实验表明,本方案在检索效率和存储开销上优于其他两种方案,并且能在耗费较少时间和存储空间的情况下准确地找到用户存储的数据。 张蜀男 蔡英 范艳芳 夏红科关键词:数据加密 密文检索 存储开销 基于隐私保护的序列模式挖掘 被引量:4 2016年 隐私保护是当前数据挖掘领域的一个研究热点,其目标是在不暴露原始数据信息的前提下准确地实现挖掘任务。针对隐私保护序列模式挖掘问题,提出了项集的布尔集合关系概念,设计了基于随机集和扰乱函数对原始序列库进行数据干扰的方法模型,并通过扰乱函数的特性还原出原始序列库的频繁序列模式的真实支持度,完成了在保护原始数据隐私的前提下准确地挖掘出频繁序列模式的任务。理论分析和实验结果表明,该方法模型具有很好的数据隐私保护性、挖掘结果准确性和算法执行高效性。 方炜炜 谢伟 黄宏博 夏红科关键词:数据挖掘 隐私保护 工程教育认证背景下离散数学课程体系的实施 被引量:7 2019年 介绍工程教育认证背景下离散数学课程的相关教学研究,从网络工程专业的培养目标出发,根据具体的毕业要求,构建相应的课程体系,从教学计划、教学过程和考核评价3方面进行探讨,并阐述该培养体系的实施过程。 夏红科关键词:工程教育认证 离散数学 课程体系 多策略概念相似度计算方法LMSW 被引量:5 2010年 本体映射是语义集成的关键,国内外对本体映射进行了深入的研究。将机器学习的方法引入到组合概念相似度的权值计算中来,提出了基于Widrow-Hoff理论的权值确定算法LMSW。通过梯度下降法来搜索最佳拟合训练样例的权向量,从而计算出组合的概念相似度,最终实现组合多种概念相似度算法的本体映射。实验表明该算法比单独使用概念相似度计算方法在查全率、查准率上均有所提高。 夏红科 郑雪峰 胡祥关键词:本体映射 概念相似度 权值分配 一种改进的Attention-Based LSTM特征选择模型 被引量:13 2018年 为了对高校学术活动进行信息提取和文本分类,基于结合注意力机制的长短期记忆网络(Attention-Based Long Short-Term Memory)特征选择模型,构建了高校学术活动分类系统。通过大量分析高校学术活动语料的特点,准确抽取学术活动的相关内容,改善了文本数据质量;提出了一种改进的Attention-Based LSTM特征选择模型,降低了数据维度,有效地突出了重点信息。实验结果表明,该方法提高了分类的准确率,其分类效果明显优于普通LSTM(Long Short-Term Memory)模型和传统模型的处理结果。 朱星嘉 李红莲 吕学强 周建设 夏红科关键词:信息提取 文本分类 一种高效的移动数据卸载方案 被引量:1 2015年 针对当前移动数据流量爆炸性增长导致网络阻塞的问题,从机会路由与移动性的角度出发,结合空间地理位置关系,提出了一种新颖的高效的低成本的移动数据卸载方案。借助图论方法寻找最佳传输路线,利用最优停止理论寻找最佳中继节点。理论分析表明,该方案相比于已有的机会式通信卸载方案更加高效,并且能够降低网络延迟。 倪明云 蔡英 夏红科 范艳芳关键词:机会路由 移动性