四川省科技支撑计划(2011SZZ027)
- 作品数:3 被引量:4H指数:1
- 相关作者:文立玉郑皎凌舒红平宋艳任玉兰更多>>
- 相关机构:成都信息工程大学成都中医药大学更多>>
- 发文基金:四川省教育厅青年基金国家自然科学基金国家重点基础研究发展计划更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于文本挖掘词频反文档频率方法的疾病症状权重挖掘研究被引量:4
- 2014年
- 词频反文档频率是文档特征权值表示的常用方法,用以评估单词对于语料库中的其中一份文件的重要程度。通过合理映射病例库与语料库的词汇关系,对词频反文档频率模型进行改进,并将改进后的词频反文档频率模型应用到针灸处方疾病症状权重挖掘中,计算出疾病所对应的各种症状权重。实验统计了106种疾病,其中与临床诊疗经验相符合的有84种,准确率达79.2%,实验表明改进的模型能得到较好的疾病症状权重鉴别效果。
- 宋艳何嘉舒红平郑皎凌梁繁荣任玉兰文立玉
- 关键词:词频疾病症状
- 演化聚类在离散制造业质量管理中的应用
- 2013年
- 针对离散制造业质量管理系统中维度高,且存在较多一致性数据的情形,设计了一种基于信息论中的信息熵,即互信息的改进聚类算法。通过实验分析,采用改进的聚类算法可有效提高聚类的正确率,并且通过演化聚类理论和方法的应用可对离散制造业质量管理提供有效的决策参考信息。
- 王鹏飞舒红平郑皎凌文立玉
- 关键词:信息熵互信息质量管理
- 基于分片的高维稀疏数据存储模式优化研究
- 2013年
- 针对大型数据库中高维稀疏关系表空字段对存储空间的占用问题,通过利用传统行存储数据库模拟列式存储数据库的工作原理,设计了一种基于分片的数据库结构。通过实验分析,数据库存储空间比原始模式降低了27.42%左右。在对高维稀疏数据中五个字段进行查询时,I/O数据块个数降低至原始模式的35.27%,对高维稀疏数据中四个字段进行查询时,I/O数据块个数降低至原始模式的28.22%,而随着字段的减少I/O数据块仍会进一步减少,从而提高了数据库的访问效率。
- 邵慧萌舒红平郑皎凌许源平文立玉
- 关键词:高维稀疏数据