南京市科技发展计划项目(2012sf542010)
- 作品数:3 被引量:29H指数:1
- 相关作者:李锋刚梁钰徐凯李玉更多>>
- 相关机构:合肥工业大学教育部更多>>
- 发文基金:南京市科技发展计划项目国家自然科学基金国家留学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 用户评论中的产品特征抽取方法研究
- 2015年
- 产品特征抽取是产品评论挖掘中的关键一步,针对现有产品评论挖掘方法对产品特征抽取的不足,提出了一种Apriori算法和文本模式相结合的产品特征抽取方法 ,并运用特征修剪算法对候选产品特征进行过滤。实验结果表明,该方法具有较好的效果。
- 徐凯周先琳
- 关键词:特征抽取APRIORI算法文本模式
- 基于LDA-wSVM模型的文本分类研究被引量:29
- 2015年
- SVM分类算法处理高维数据具有较大优势,但其未考虑语义的相似性度量问题,而LDA主题模型可以解决传统的文本分类中相似性度量和主题单一性问题。为了充分结合SVM和LDA算法的优势并提高分类精确度,提出了一种新的LDA-w SVM高效分类算法模型。利用LDA主题模型进行建模和特征选择,确定主题数和隐主题—文本矩阵;在经典权重计算方法上作改进,考虑各特征项与类别的关联度,设计了一种新的权重计算方法;在特征词空间上使用这种基于权重计算的w SVM分类器进行分类。实验基于R软件平台对搜狗实验室的新闻文本集进行分类,得到了宏平均值为0.943的高精确度分类结果。实验结果表明,提出的LDA-w SVM模型在文本自动分类中具有很好的优越性能。
- 李锋刚梁钰GAO Xiao-zhiZENGER Kai
- 关键词:文本分类支持向量机
- 基于形式概念分析的治痹用药规律挖掘
- 2014年
- 本文将形式概念分析理论应用于新安医籍中的治痹用药规律挖掘,借助概念格构建工具LatticeMiner软件对新安医籍治痹资料表进行形式背景和概念格的构建。通过构建方剂-证型、方剂-症状以及方剂-药材概念格直观地展示出痹病证型、症状、药材和对应的方剂的层次结构,便于挖掘痹病证型、症状的分布情况以及组方用药情况,并通过嵌入式形式背景构建对证型、症状和药材之间的关系更加结构化地展示,最后通过基于FCA的关联规则挖掘方法对证型、症状和药材三者的关联规则进行挖掘,为中医方面的数据挖掘研究提供了一种新的思路。
- 李锋刚李玉高晓智凯.曾格
- 关键词:形式概念分析概念格新安医学痹病关联规则