您的位置: 专家智库 > >

罗丽娟

作品数:2 被引量:16H指数:2
供职机构:南昌大学信息工程学院更多>>
发文基金:International Foundation for Science国家自然科学基金更多>>
相关领域:自动化与计算机技术电子电信更多>>

文献类型

  • 2篇中文期刊文章

领域

  • 2篇自动化与计算...
  • 1篇电子电信

主题

  • 1篇信贷
  • 1篇信息增益
  • 1篇信息增益率
  • 1篇逾期
  • 1篇召回率
  • 1篇中文
  • 1篇中文分词
  • 1篇新词
  • 1篇新词识别
  • 1篇构词
  • 1篇构词规则
  • 1篇分词

机构

  • 2篇南昌大学

作者

  • 2篇段隆振
  • 2篇罗丽娟
  • 1篇段文影
  • 1篇刘萍
  • 1篇黄水源

传媒

  • 1篇南昌大学学报...
  • 1篇现代电子技术

年份

  • 1篇2019
  • 1篇2017
2 条 记 录,以下是 1-2
排序方式:
基于规则和N-Gram算法的新词识别研究被引量:5
2019年
当前的分词工具分词后会出现很多单字碎片,分词之后意义与原意相差甚远。同时因为新词的构词规则具有自由度大的特点,当前分词方法不能有效识别网络中的新词。在ICTCLAS2016分词系统的基础上,结合新词结构制定规则构建碎片库,利用Bi-gram和Tri-gram模式提取碎片库中的候选字串,再采用左右邻接熵进行扩展及过滤,最后提出基于规则和N-Gram算法的新词识别方法。结果表明使用该方法的分词效果准确率、召回率和F值都有所提高。实验结果表明,该新词识别方法能有效构造候选新词集合,提高中文分词效果。
姜如霞黄水源段隆振罗丽娟
关键词:新词识别构词规则中文分词召回率
C5.0算法的改进及应用被引量:11
2017年
C5.0算法是一种直观、效率高的分类方法,但该算法存在信息增益率计算复杂、容易出现过拟合和决策树偏倚的问题。针对这些问题,通过公式的转换简化信息增益率的计算过程,在剪枝过程采用了损失矩阵和置信区间的结合进行剪枝判断,以及对建立的多个模型的权重进行调整,提出了一种新的C5.0改进算法,并将其应用于信贷逾期预测上。使用借款人的历史还款数据进行实验,并与其他算法进行比较,结果表明:C5.0改进算法相比其他算法具有更高的准确率和效率。
罗丽娟段隆振段文影刘萍
关键词:信息增益率
共1页<1>
聚类工具0