杨琳
- 作品数:4 被引量:1H指数:1
- 供职机构:河南工业大学信息科学与工程学院更多>>
- 发文基金:国家高技术研究发展计划更多>>
- 相关领域:自动化与计算机技术理学更多>>
- 一种新型的自动摘要冗余处理技术研究
- 2014年
- 技术目前已经成为计算机语言学领域的一个研究热点。本文讨论了自动摘要的定义和分类。针对自动文摘中主题句的冗余现象,提出了一种新型的自动摘要冗余处理的方法。该方法将初始文摘中的句子表示成句链.根据任意文摘句中所有特征词的激活水平、初始化水平、影响因子以及语句相干性公式,计算其与其它初始文摘中句子的相干性.去除相干性比较大的冗余句子,从而得到最终的自动摘要。
- 唐亚娟张德贤杨琳
- 粮食网络舆情分析技术研究
- 随着Internet发展、网民规模扩大,网络不再只是一种信息资源平台,更成为一种民意表达的渠道。对于热传的粮食舆情热点事件,民众除在网络平台上浏览获取最新消息,还抒发情绪、表明态度、表达观点,网络新闻已然成为反映粮食相关...
- 杨琳
- 关键词:网络舆情中文分词
- 文献传递
- 基于方差分析的χ~2统计特征选择改进算法研究
- 2015年
- 特征选择是中文文本分类的一个重要研究领域,是提高学习算法性能的一个重要手段,也是模式识别中数据预处理的关键步骤。该文对特征提取的定义及其分类进行了深入分析,介绍了几种常用的经典特征选择方法,并针对特征选择研究过程中存在的不足,提出了基于方差分析的χ2统计特征选择改进算法。该算法在引入方差分析思想的基础上,向传统的χ2统计特征选择算法融入特征频数、文档间均衡因子和文档内均衡因子三个元素和一个制约条件,对于提高其性能方面起到很大作用。
- 唐亚娟张德贤杨琳
- 基于热点文件下载的网络舆情信息挖掘方法研究被引量:1
- 2014年
- 网络信息量的逐年增长,使得获取网络敏感的舆情信息并做出相应的监控处理变得十分重要,网络舆情信息挖掘技术研究十分活跃。本文介绍舆情挖掘步骤及其核心算法,分析互联网热点文件下载曲线与网络舆情发展曲线的关联,通过关联关系对互联网文件下载数据进行信息挖掘,从中找出是否存在符合曲线发展规律的热点文件,最终将文件的主题与当时的网络舆情信息进行比对,对结果进行验证,为网络舆情的监测提出了一种新的方法。
- 杨琳张德贤唐亚娟
- 关键词:网络舆情信息挖掘