谢松县
- 作品数:9 被引量:22H指数:3
- 供职机构:国防科学技术大学计算机学院更多>>
- 发文基金:国家自然科学基金更多>>
- 相关领域:自动化与计算机技术轻工技术与工程金属学及工艺更多>>
- 关系抽取中远监督错误标注消除被引量:1
- 2018年
- 目前远监督方法被广泛应用于关系抽取任务。然而,远监督方法中存在大量错误标注现象,给远监督方法的学习效果带来了很大的影响。提出利用语义Jaccard度量关系短语与依存词间语义相似性的错误标注消除方法。消除错误标注后的训练数据用于训练模型,完成关系抽取。实验结果表明:该方法可以有效消除错误标注,提高关系抽取的性能。
- 汝承森唐晋韬谢松县李莎莎王挺
- 关键词:关系抽取语义相似性
- 基于Windows 2000的开放式切割机数控系统设计
- 2003年
- 介绍了基于Windows 2 0 0 0的切割机数控系统 ,该系统充分运用了开放式数控系统多层次、模块化和开放式的设计方法。针对切割机这一特殊的数控系统 ,分析了割缝补偿、速度预处理、PLC等几个重要功能模块的实现方法。
- 龙佑喜谢松县杨帆孙海洋
- 关键词:WINDOWS2000数控系统PLC运动控制器
- 应用语义关系自动构建情感词典被引量:7
- 2014年
- 构建英文情感词典研究相对成熟,形成了丰富可靠的词典资源。而针对中文的研究时间短,中文情感分析词典资源较少。借鉴现有可靠的英文词典资源,提出了基于语义关系的情感词典自动构建算法,算法先从HowNet的概念中进行中文义原和词语抽取及语义分析,再利用HowNet概念中DEF中英文属性值,在英文情感词典SentWordNet中进行义原和词语情感值查询,最后根据词语和义原之间的语义关系进行词语的情感值计算。算法直接利用现有的英文情感词典,无须人工标注,生成的情感词典记录了词语的语义关系、情感极性值等多种信息,弥补了现有词典的不足。评测实验结果表明,根据算法实现的情感词典相比其他词典在准确率接近的情况下,召回率和F值最高,取得了较好的评测性能。
- 谢松县刘博王挺
- 关键词:情感分析情感词典HOWNET语义关系
- 基于词向量语义聚类的微博热点挖掘方法被引量:2
- 2018年
- 随着社交媒体的迅速发展,信息过载问题越发严重,因此如何从海量、短小而充满噪声的社交媒体数据中发现和挖掘出热点话题或者热点事件成为一个重要的问题。结合社交媒体数据实时性、地理性、包含较多元数据等特点,提出了用户行为分析与文本内容分析相结合的热点挖掘方法。在内容分析过程中,提出了从更细的词语粒度进行聚类,以代替传统的在消息粒度进行聚类的经典方法。为了提高话题关键词提取的效果,引入了基于词向量技术,并通过语义聚类的方法进行热点挖掘。在真实数据集上的实验结果表明,该方法提取的关键词语义关联性强、话题划分效果好,在主要指标上优于传统的热点挖掘方法。
- 刘培磊唐晋韬王挺谢松县岳大鹏刘海池
- 关键词:社交媒体语义聚类
- 增量式神经网络聚类算法被引量:2
- 2016年
- 神经网络模型具有强大的问题建模能力,但是传统的反向传播算法只能进行批量监督学习,并且训练开销很大。针对传统算法的不足,提出全新的增量式神经网络模型及其聚类算法。该模型基于生物神经学实验证据,引入新的神经元激励函数和突触调节函数,赋予模型以坚实的统计理论基础。在此基础上,提出一种自适应的增量式神经网络聚类算法。算法中引入"胜者得全"式竞争等学习机制,在增量聚类过程中成功避免了"遗忘灾难"问题。在经典数据集上的实验结果表明:该聚类算法与K-means等传统聚类算法效果相当,特别是在增量学习任务的时空开销方面具有较大优势。
- 刘培磊唐晋韬谢松县王挺
- 关键词:神经网络聚类算法时间开销
- 一种基于动态网页解析的微博数据抓取方法被引量:3
- 2015年
- 微博是一种新型信息传播媒介,产生的海量数据吸引研究人员关注并开展相关研究。微博数据获取是后续分析研究的基础和起点。以新浪微博平台为研究对象,提出了基于动态网页解析技术的微博数据多线程抓取方法。方法利用浏览器内核解析微博页面动态数据,通过模拟登陆,依据社交网站网页链接特点确定页面爬取策略,使用页面解析技术定制页面数据抽取模板,实现以用户为中心的微博数据获取。抓取结果表明,方法能对微博用户数据进行全面高效抓取,为后续数据分析和处理提供数据支持。
- 钟明翔唐晋韬谢松县王挺
- 关键词:数据挖掘动态网页爬虫
- 社交媒体中观点信息分析与应用
- 随着社交媒体的日益普及,互联网用户越来越习惯于在社交媒体中评论话题、表达观点。社交媒体用户规模庞大,观点涉及话题广泛,使其成为包含大量针对流行话题的用户观点的宝贵资源库。然而用户表达观点的方式多种多样,使得社会媒体中的观...
- 谢松县
- 关键词:社交媒体情感词典信息传播用户行为自然语言处理
- 一种基于混合特征的中文情感词典扩展方法被引量:5
- 2016年
- 覆盖面广且领域适应性好的情感词典可以有效提高文本情感分析效能。设计了基于连词语言特征和词性特征向量统计特征的中文情感词典扩展算法,提出了综合两种方法的混合特征算法。算法计算得到词语的细粒度的积极和消极情感极性值,并对通用情感词典在领域内进行扩展以提高覆盖度,对词典进行领域内调整以提高适应性。实验结果表明,算法在领域内扩展获得的词典比通用情感词典覆盖度和适应性更好,在情感分类任务中性能接近有监督方法。
- 谢松县赵舒怡
- 关键词:情感分析情感词典语言特征统计特征
- 凹版印刷机无轴套色控制系统研究
- 套色控制系统,是包装印刷机的重要组成部分,负责控制各印色的准确定位,对印刷质量起着决定作用。随着电机控制技术、计算机技术以及信息技术的发展,出现了机械轴电子化的技术,即电子轴传动(也叫无轴传动)技术,无轴传动技术应用到套...
- 谢松县
- 关键词:无轴传动运动控制PID控制以太网套色