您的位置: 专家智库 > >

郑晓刚

作品数:5 被引量:12H指数:1
供职机构:河海大学更多>>
发文基金:国家自然科学基金江苏省“青蓝工程”中青年学术带头人培养对象资助项目更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 3篇期刊文章
  • 2篇专利

领域

  • 4篇自动化与计算...

主题

  • 2篇语义本体
  • 2篇歧义
  • 2篇歧义词
  • 2篇中文
  • 2篇中文分词
  • 2篇自动生成
  • 2篇自动生成算法
  • 2篇聚类
  • 2篇分词
  • 2篇本体
  • 1篇袋模型
  • 1篇信息处理
  • 1篇信息增益
  • 1篇隐马尔可夫模...
  • 1篇舆情
  • 1篇舆情分析
  • 1篇中文分词方法
  • 1篇中文信息
  • 1篇中文信息处理
  • 1篇中文自动分词

机构

  • 5篇河海大学
  • 1篇东南大学

作者

  • 5篇郑晓刚
  • 5篇韩立新
  • 3篇曾晓勤
  • 3篇白书奎
  • 2篇朱利达
  • 2篇刘合兵
  • 2篇张钰
  • 1篇殷俊环
  • 1篇张银川

传媒

  • 2篇计算机应用与...
  • 1篇信息技术

年份

  • 1篇2017
  • 1篇2015
  • 1篇2013
  • 2篇2012
5 条 记 录,以下是 1-5
排序方式:
基于双聚类的微博用户标签自动生成算法
本发明公开了一种基于双聚类的微博用户标签自动生成算法,其特征在于:包括以下步骤:以维基百科为基础,采用双聚类算法构建语义本体;获取微博用户的微博信息并进行预处理,得到词袋模型;利用语义本体从词袋模型中提取词,并对有歧义词...
刘合兵韩立新张钰郑晓刚朱利达
文献传递
一种组合型中文分词方法被引量:11
2012年
设计一种组合型的分词机制:基于字典的双向最大匹配,基于字标注的中文分词方法和隐马尔科夫的分词方式。通过实验的结果比较,表明该种组合型的分词方法能够较好地解决中文歧义并发现新的登录词。
郑晓刚韩立新白书奎曾晓勤
关键词:中文信息处理中文自动分词
一种基于信息增益和改进的PageRank的关键字提取方法
2012年
传统的关键字提取方法一般基于TFIDF,不仅消耗的时间过多,而且效果也不理想。提出用信息增益的思想来对文中的词进行权重的计算,并在此基础上结合改进的PageRank来提取文中的关键字。实验结果表明,该种方法得到的结果明显优于传统方法得到的结果。
郑晓刚韩立新白书奎曾晓勤
关键词:关键字提取信息增益PAGERANK
基于双聚类的微博用户标签自动生成算法
本发明公开了一种基于双聚类的微博用户标签自动生成算法,其特征在于:包括以下步骤:以维基百科为基础,采用双聚类算法构建语义本体;获取微博用户的微博信息并进行预处理,得到词袋模型;利用语义本体从词袋模型中提取词,并对有歧义词...
刘合兵韩立新张钰郑晓刚朱利达
一种舆情分析中的文本分类方法被引量:1
2013年
文中设计并实现了一种舆情分析中的文本分类方法。使用改进的隐马尔可夫分词方法对文本分词,结合Boosting算法生成动态停用词词库的贝叶斯文本分类方法对测试数据集分类。实验数据表明,该分类方法能取得较好的文本分类结果。
白书奎韩立新殷俊环郑晓刚张银川曾晓勤
关键词:隐马尔可夫模型中文分词贝叶斯BOOSTING算法
共1页<1>
聚类工具0