您的位置: 专家智库 > >

白书奎

作品数:4 被引量:13H指数:2
供职机构:河海大学计算机与信息学院更多>>
发文基金:国家自然科学基金江苏省“青蓝工程”中青年学术带头人培养对象资助项目更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 4篇中文期刊文章

领域

  • 4篇自动化与计算...

主题

  • 2篇中文
  • 2篇中文分词
  • 2篇分词
  • 1篇信息处理
  • 1篇信息增益
  • 1篇隐层
  • 1篇隐马尔可夫模...
  • 1篇舆情
  • 1篇舆情分析
  • 1篇中文分词方法
  • 1篇中文信息
  • 1篇中文信息处理
  • 1篇中文自动分词
  • 1篇种组
  • 1篇自动分词
  • 1篇文本分类
  • 1篇文本分类方法
  • 1篇马尔可夫
  • 1篇马尔可夫模型
  • 1篇矩阵

机构

  • 4篇河海大学
  • 1篇东南大学

作者

  • 4篇白书奎
  • 3篇郑晓刚
  • 3篇韩立新
  • 3篇曾晓勤
  • 2篇张银川
  • 1篇殷俊环

传媒

  • 2篇计算机应用与...
  • 1篇计算机应用
  • 1篇信息技术

年份

  • 1篇2013
  • 3篇2012
4 条 记 录,以下是 1-4
排序方式:
一种舆情分析中的文本分类方法被引量:2
2013年
文中设计并实现了一种舆情分析中的文本分类方法。使用改进的隐马尔可夫分词方法对文本分词,结合Boosting算法生成动态停用词词库的贝叶斯文本分类方法对测试数据集分类。实验数据表明,该分类方法能取得较好的文本分类结果。
白书奎韩立新殷俊环郑晓刚张银川曾晓勤
关键词:隐马尔可夫模型中文分词贝叶斯BOOSTING算法
基于矩阵运算的单隐层Madaline网络批量学习
2012年
针对前向离散型单隐层Madaline网络建立了以矩阵为基础的数学模型,结合高维空间超平面划分理论,通过对表示样本的矩阵与代表网络性质的矩阵进行分析运算,在输入样本维度较低的情况下给出了Madaline网络的批量学习方法。该方法可有效地解决离散数据的两类分类问题。
张银川白书奎
关键词:矩阵运算
一种组合型中文分词方法被引量:11
2012年
设计一种组合型的分词机制:基于字典的双向最大匹配,基于字标注的中文分词方法和隐马尔科夫的分词方式。通过实验的结果比较,表明该种组合型的分词方法能够较好地解决中文歧义并发现新的登录词。
郑晓刚韩立新白书奎曾晓勤
关键词:中文信息处理中文自动分词
一种基于信息增益和改进的PageRank的关键字提取方法
2012年
传统的关键字提取方法一般基于TFIDF,不仅消耗的时间过多,而且效果也不理想。提出用信息增益的思想来对文中的词进行权重的计算,并在此基础上结合改进的PageRank来提取文中的关键字。实验结果表明,该种方法得到的结果明显优于传统方法得到的结果。
郑晓刚韩立新白书奎曾晓勤
关键词:关键字提取信息增益PAGERANK
共1页<1>
聚类工具0