张艳辉
- 作品数:5 被引量:23H指数:3
- 供职机构:山东省分布式计算机软件新技术重点实验室更多>>
- 发文基金:山东省自然科学基金国家自然科学基金国家社会科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于潜在狄利克雷分布模型的多文档情感摘要被引量:9
- 2014年
- 针对当前方法难以获取评论文本全局情感倾向性的问题,提出一种基于潜在狄利克雷分布(LDA)模型的多文档情感摘要方法。该方法首先对给定的句子进行情感分析,抽取带有主观性评价的句子;然后,应用LDA模型表示已抽取的句子,并通过词汇的重要度和句子的特征计算句子的权重;最终提取情感文摘。实验结果表明,该方法能够有效地识别情感关键句,在准确率、召回率和F值上均有不错的效果。
- 荀静刘培玉杨玉珍张艳辉
- 关键词:情感分析多文档摘要
- 融合表情符号的微博文本倾向性分析
- 在现代社会中,随着互联网和新媒体的飞速发展,微博呈现爆发性的增长,越来越多的人开始使用微博。在微博上,人们可以实时发布消息来表达对现实生活中各种问题的观点看法,讨论当前热点话题,共享信息资源等。微博用户之间通过相互关注,...
- 张艳辉
- 关键词:文本倾向性表情符号
- 文献传递
- 基于动态阈值和命名实体的双重过滤话题追踪被引量:6
- 2015年
- 针对话题追踪静态阈值的缺点和虚假相关报道问题,提出一种基于动态阈值和命名实体双重过滤的话题追踪方法。该方法中,研究了KL距离计算初始阈值,并筛选出候选报道;然后,根据报道时间特点研究了动态阈值方法;最后,抽取追踪话题和测试报道中命名实体,计算命名实体间的相似度以及命名实体相同的个数来选出相关报道,完成话题追踪。通过实验证明该方法的可行性,实验结果表明基于动态阈值和命名实体双重过滤方法能有效地改善话题追踪的性能,并有效降低了话题追踪的误报率和漏报率。
- 魏景璇鲁燃张艳辉
- 关键词:动态阈值KL距离
- 融合表情符号的微博文本倾向性分析被引量:5
- 2014年
- 针对目前微博倾向性分析的研究主要集中在微博文本上,而没有考虑微博中其他情感因素影响的问题,通过对新浪微博的分析与研究,在传统的情感词典的基础上,通过加入表情符号词典和网络新词,构建专门的微博词典,同时对微博进行修辞分析和句式分析,以有效提高倾向性分析的效果。实验结果表明,该方法在对微博进行倾向性分析时取得了很好的效果。
- 刘培玉张艳辉朱振方荀静
- 关键词:表情符号
- 基于互信息的微博新词发现算法被引量:1
- 2015年
- 微博是一种近些年来兴起的互联网媒体,每时每刻都会产生各种新生的网络词汇。对于新词发现算法中表现出的缺点,文中提出了一种基于互信息的微博新词发现算法,将互信息合并多字词的方式应用到微博新词的发现中,并且通过实验验证了本文算法对于微博新词发现的有效性。
- 张艳辉刘培玉
- 关键词:新词发现互信息