您的位置: 专家智库 > >

江苏省自然科学基金(BK2009233)

作品数:3 被引量:52H指数:2
相关作者:贾修一李伟湋商琳陈家骏张莉更多>>
相关机构:南京大学南京航空航天大学华东师范大学更多>>
发文基金:江苏省自然科学基金国家重点基础研究发展计划教育部人文社会科学重点研究基地度重大研究项目更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 3篇期刊文章
  • 1篇会议论文

领域

  • 4篇自动化与计算...

主题

  • 1篇对象抽取
  • 1篇数据挖掘
  • 1篇随机场
  • 1篇损失函数
  • 1篇特征选择算法
  • 1篇条件随机场
  • 1篇评价对象抽取
  • 1篇自适
  • 1篇自适应
  • 1篇阈值
  • 1篇句法
  • 1篇句法关系
  • 1篇共指消解
  • 1篇核心句
  • 1篇抽取
  • 1篇粗糙集
  • 1篇粗糙集方法
  • 1篇粗糙集理论

机构

  • 4篇南京大学
  • 2篇南京航空航天...
  • 1篇华东师范大学

作者

  • 3篇贾修一
  • 2篇李伟湋
  • 1篇陈家骏
  • 1篇钱玲飞
  • 1篇许鑫
  • 1篇商琳
  • 1篇张莉

传媒

  • 1篇电子学报
  • 1篇计算机应用
  • 1篇中文信息学报

年份

  • 3篇2011
  • 1篇2010
3 条 记 录,以下是 1-4
排序方式:
基于核心句及句法关系的评价对象抽取被引量:22
2011年
意见挖掘已成为近年来的热点问题,该文针对COAE2009评测中的意见挖掘任务的一项子任务——评价对象抽取进行了研究。首先提出利用核心句进行学习的思想,继而确定了10种句法关系作为语言特征,将原始句和核心句分别基于词、词性和句法关系利用条件随机场模型进行学习和比较,在后期又利用二次学习的方式进一步提高了抽取性能。实验取得了相对不错的抽取效果,证明我们提出的方法是可行的,且具有一定的应用价值。
张莉钱玲飞许鑫
关键词:评价对象抽取核心句句法关系条件随机场
基于Hellinger距离的特征选择算法被引量:2
2010年
针对数据挖掘中的特征选择问题,依据Hellinger距离的特性,研究了两种Hellinger距离的定义方式,提出了基于Hellinger距离的特征选择方法,设计了两种相应的算法。不同数据集上的实验结果表明了新算法选择的特征的有效性。与其他特征选择算法的对比可发现:这两种算法选择的特征个数少且对C4.5分类精度较好。
李伟湋贾修一
关键词:数据挖掘
基于粗糙集方法的共指消解
选择合适的特征是共指消解任务中一个重要的组成部分。特征不是越多越好,反映本质的特征很重要;对于不同种类的语料,一个公共的特征集往往难以适应,为了提高特征对语料的针对性,对不同的语料应选择不同的特征。本文基于上述观点,采用...
贾修一张亚兵陈家骏商琳
关键词:共指消解粗糙集理论
文献传递
一种自适应求三枝决策中决策阈值的算法被引量:28
2011年
在三枝决策粗糙集模型中,基于贝叶斯决策理论,在给定的损失函数基础上可以计算出不同决策之间的阈值,从而可以推导出各种现有的概率型粗糙集模型,如可变精度粗糙集模型等.但是决策粗糙集模型需要对损失函数预先设定,这就需要合适的先验知识.本文通过研究三枝决策粗糙集模型中的风险损失和建立模型需要的阈值参数之间的关系,提出了一个最优化问题,给出了理论分析,说明解决该优化问题即可求得所需参数,并给出了一种自适应求阈值参数的算法.该算法将每个样本的条件概率作为搜索空间,以决策风险损失最小化为目标,求得的损失函数和阈值能够使得用户基于此作出的风险最小.在部分数据集上的实验也表明了算法的有效性,利用学习到的阈值建立的三枝决策粗糙集模型能够取得更好的分类性能.
贾修一李伟湋商琳陈家骏
关键词:损失函数阈值
共1页<1>
聚类工具0