谢珏
- 作品数:3 被引量:23H指数:2
- 供职机构:东南大学更多>>
- 发文基金:国家高技术研究发展计划国家自然科学基金中央高校基本科研业务费专项资金更多>>
- 相关领域:自动化与计算机技术天文地球更多>>
- 基于逻辑回归的中文在线评论有效性检测模型被引量:11
- 2015年
- 为了实现电子商务和社交网络中文在线评论有效性的自动化检测,提出了一种单一主题环境下基于逻辑回归的垃圾评论检测模型.中文在线评论有效性的检测可以归结为分类问题,结合中文在线评论的特点提取了9个特征以构建分类模型;为获取核心特征主题的相关度,采用基于关联规则的评论名词模式优化了ICTCLAS中文分词系统的主题识别,进而利用交叉语言模型获取在线评论主题相关度.实验中采取了人为标定的1 000条评论作为样本,把支持向量机分类模型作为对比进行试验,利用数据挖掘工具Weka进行计算.结果表明,采用优化评论名词模式下基于逻辑回归的垃圾评论检测模型结果的准确率达到83.54%,比支持向量机分类模型计算得到的准确率高2.10%.
- 吴含前朱云杰谢珏
- 关键词:逻辑回归关联规则
- 一种改进的A-KAZE算法在图像配准中的应用被引量:10
- 2017年
- 针对现有图像配准过程中难以保持图像的局部精度和边缘细节的问题,在A-KAZE算法的基础上提出了一种改进的图像特征提取算法AKAZE-ILDB.该算法首先利用非线性扩散滤波方程构造图像金字塔,采用快速显示扩散(FED)求得数值解,得到具有亚像素精度的图像特征点坐标;然后利用改进的LDB(ILDB)描述子构造具有尺度和旋转不变性的图像特征向量,对特征向量采用汉明距离进行KNN匹配;最后基于仿射变换模型计算空间映射参数矩阵来实现图像配准.实验结果表明:在保持相同图像特征匹配正确率的情况下,AKAZE-ILDB算法比A-KAZE算法平均配准时间缩短了300 ms;在配准精度方面,比A-KAZE算法提高了3.7%,比传统特征提取算法SURF匹配正确率提高了29%.
- 吴含前李程超谢珏
- 关键词:非线性扩散滤波FED仿射变换
- 二次剪枝算法在评论特征提取中的应用被引量:2
- 2016年
- 针对序列模式挖掘(GSP)算法在中文产品评论特征提取中准确率不够高的问题,提出了一种二次剪枝算法,即利用GSP算法产生候选特征集,然后采用词对共现度作为阈值对其进行进一步筛选,从而达到提高准确率的目的.利用定制化的爬虫工具从京东网站上抓取摄像头产品的中文评论,选取其中1 000条作为试验数据,采用分词工具ICTCLAS对评论进行分词和数据预处理,并将所提算法与GSP算法、交叉语言模型(CLM)和似然比检验(LRT)进行对比试验.结果表明,利用所提算法获得的中文产品评论特征提取准确率达到76.37%,较GSP算法、CLM和LRT的准确率分别提高2.94%,5.77%和7.57%.
- 吴含前周立凤谢珏
- 关键词:特征提取似然比检验