白书奎
- 作品数:4 被引量:13H指数:2
- 供职机构:河海大学计算机与信息学院更多>>
- 发文基金:国家自然科学基金江苏省“青蓝工程”中青年学术带头人培养对象资助项目更多>>
- 相关领域:自动化与计算机技术更多>>
- 一种舆情分析中的文本分类方法被引量:2
- 2013年
- 文中设计并实现了一种舆情分析中的文本分类方法。使用改进的隐马尔可夫分词方法对文本分词,结合Boosting算法生成动态停用词词库的贝叶斯文本分类方法对测试数据集分类。实验数据表明,该分类方法能取得较好的文本分类结果。
- 白书奎韩立新殷俊环郑晓刚张银川曾晓勤
- 关键词:隐马尔可夫模型中文分词贝叶斯BOOSTING算法
- 基于矩阵运算的单隐层Madaline网络批量学习
- 2012年
- 针对前向离散型单隐层Madaline网络建立了以矩阵为基础的数学模型,结合高维空间超平面划分理论,通过对表示样本的矩阵与代表网络性质的矩阵进行分析运算,在输入样本维度较低的情况下给出了Madaline网络的批量学习方法。该方法可有效地解决离散数据的两类分类问题。
- 张银川白书奎
- 关键词:矩阵运算
- 一种组合型中文分词方法被引量:11
- 2012年
- 设计一种组合型的分词机制:基于字典的双向最大匹配,基于字标注的中文分词方法和隐马尔科夫的分词方式。通过实验的结果比较,表明该种组合型的分词方法能够较好地解决中文歧义并发现新的登录词。
- 郑晓刚韩立新白书奎曾晓勤
- 关键词:中文信息处理中文自动分词
- 一种基于信息增益和改进的PageRank的关键字提取方法
- 2012年
- 传统的关键字提取方法一般基于TFIDF,不仅消耗的时间过多,而且效果也不理想。提出用信息增益的思想来对文中的词进行权重的计算,并在此基础上结合改进的PageRank来提取文中的关键字。实验结果表明,该种方法得到的结果明显优于传统方法得到的结果。
- 郑晓刚韩立新白书奎曾晓勤
- 关键词:关键字提取信息增益PAGERANK