山东省教育厅科技计划(J09LG52)
- 作品数:3 被引量:26H指数:3
- 相关作者:刘培玉赵爱华郑燕贾娴公伟更多>>
- 相关机构:山东师范大学山东省分布式计算机软件新技术重点实验室山东警察学院更多>>
- 发文基金:国家自然科学基金山东省教育厅科技计划山东省自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于LDA的新闻话题子话题划分方法被引量:18
- 2013年
- 针对目前网络热点新闻话题中存在的难以区分一个话题下的多个子话题现象,提出一种基于LDA模型的子话题划分方法.首先应用LDA模型对新闻文档进行建模,采用贝叶斯标准方法确定最优主题个数,使LDA模型拟合文档性能达到最佳;其次针对子话题间文本相似度较高的特点,引入主题特征词相关性分析,采用改进的KL距离公式,计算新闻文档之间相似度,有效区分了文档内容相似但话题重点不同的报道;最后通过single-pass增量聚类算法进行文档聚类,实现子话题划分.实验验证了改进后的相似度计算方法的有效性,实验结果表明该方法能够有效地提高热点新闻话题子话题划分的准确率.
- 赵爱华刘培玉郑燕
- 关键词:KL距离相似度计算
- 云取证模型的构建与分析被引量:5
- 2012年
- 计算机取证存在证据获取困难及日志处理量大的问题。为此,将云计算思想引入计算机取证中,提出一种云取证模型。该模型利用Agent技术获取证据,增强证据获取的自主性、智能性,利用云计算中的虚拟化技术和协作技术,提高取证效率及计算机证据的安全性,引入反馈技术,完善取证体制。实验结果验证了该模型的有效性。
- 公伟刘培玉迟学芝贾娴
- 关键词:计算机取证云计算智能体虚拟化技术
- 基于排序索引矩阵的频繁项集挖掘算法被引量:3
- 2012年
- 针对Apriori算法产生候选项集的问题,提出一种基于排序索引矩阵(SIM)的频繁项集挖掘算法。将频繁1-项集形成的1-项集向量依次与对应矩阵相乘,生成频繁2-项集。从频繁3-项集开始,对每次生成的频繁k-项集建立SIM,借助SIM结构实现项集的跨越式搜索和连接。整个过程只需扫描一次数据库,不会产生候选项集。实验结果表明,该算法能提高频繁项集的挖掘效率。
- 荀娇徐连诚杨仁华
- 关键词:关联规则候选项集频繁项集