您的位置: 专家智库 > >

国家重点基础研究发展计划(G1998030510)

作品数:8 被引量:556H指数:8
相关作者:白硕鲁松卜东波黄雄刘群更多>>
相关机构:中国科学院更多>>
发文基金:国家重点基础研究发展计划国家自然科学基金国家高技术研究发展计划更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 8篇期刊文章
  • 4篇会议论文

领域

  • 12篇自动化与计算...

主题

  • 4篇自然语言
  • 3篇知识库
  • 3篇问答系统
  • 3篇向量
  • 3篇向量空间
  • 3篇向量空间模型
  • 2篇信息增益
  • 2篇语言处理
  • 2篇推理机
  • 2篇自然语言处理
  • 2篇自然语言理解
  • 2篇消歧
  • 2篇词义消歧
  • 1篇动态知识
  • 1篇动态知识库
  • 1篇信息处理
  • 1篇信息过滤
  • 1篇信息粒
  • 1篇信息粒度
  • 1篇学习算法

机构

  • 11篇中国科学院

作者

  • 7篇白硕
  • 5篇鲁松
  • 4篇白硕
  • 3篇王树西
  • 3篇刘群
  • 2篇许洪波
  • 2篇姜吉发
  • 2篇卜东波
  • 2篇黄雄
  • 2篇程学旗
  • 2篇王斌
  • 1篇王实
  • 1篇李晓黎
  • 1篇李素建
  • 1篇李国杰
  • 1篇张健

传媒

  • 3篇计算机学报
  • 2篇软件学报
  • 1篇计算机研究与...
  • 1篇计算机工程与...
  • 1篇中文信息学报
  • 1篇NCIRCS...

年份

  • 1篇2004
  • 3篇2003
  • 4篇2002
  • 3篇2001
  • 1篇2000
8 条 记 录,以下是 1-10
排序方式:
基于动态知识库的问答系统研究
问答系统有着较长的历史。本文在综述现有问答系统的基础上,提出“动态知识库”的概念,并基于此,搭建了“亲属关系问答系统”,在知识获取、问答系统发展趋势等方面,进行了一定的探索。
王树西刘群白硕王斌程学旗姜吉发
关键词:问答系统动态知识库知识获取
文献传递
自然语言处理中词语上下文有效范围的定量描述被引量:68
2001年
词语的上下文 (context)是语料库语言学中自然语言知识获取和解决自然语言处理中多种实际应用问题必须依靠的资源和基础 .但上下文“窗口”开多大为宜呢 ?为克服当前仅凭主观经验或通过某一特定应用问题中最终结果正确率界定上下文有效范围的不足 ,我们在引入信息增益方法确定上下文各位置的信息量后 ,构造上下文位置信息量函数 ,最终通过多项式积分确定 85 %信息量的上下文边界 ,即汉语核心词语最近距离 [- 8,+9]和英文[- 16 ,+13]位置之间的上下文范围 .
鲁松白硕
关键词:信息增益自然语言处理词语计算机
基于自由文本的模式推理
本文首先指出模式推理在问答系统中的应用,以及模式推理的基本方法。为了进行模式推理,必须对文本以及推理规则中的常量、变量,进行一体化索引。本文提出并实现了常量、变量一体化索引的算法,并给出了算法分析。实验结果表明:该算法可...
王树西白硕姜吉发
关键词:问答系统自由文本
文献传递
TREC自适应信息过滤中的目标优化技术研究
TREC是信息检索领域最重要的国际评测会议,自适应信息过滤是TREC的关键任务之一,自适应阈值调整中评测指标的优化是自适应过滤任务中非常重要的研究方向,我们借鉴优化学习的思想,以TREC的评测指标为目标函数,提出了针对全...
许洪波王斌程学旗白硕
关键词:TREC阈值调整
文献传递
红楼梦人物关系问答系统
论文在分析专家系统起源、发展,现有理论技术的基础上,采用自然语言问答的人机交互方式,搭建了《红楼梦人物关系问答系统》,对专家系统现存的问题进行了有益的探索。测试结果表明,该系统知识完备,表示方法及组织方法适当,求解问题质...
王树西刘群白硕
关键词:知识库规则库模式库推理机
文献传递
基于向量空间模型中义项词语的无导词义消歧被引量:62
2002年
有导词义消歧机器学习方法的引入虽然使词义消歧取得了长足的进步,但由于需要大量人力进行词义标注,使其难以适用于大规模词义消歧任务.针对这一问题,提出了一种避免人工词义标注巨大工作量的无导学习方法.在仅需义项词语知识库的支持下,将待消歧多义词与义项词语映射到向量空间中,基于k-NN(k=1)方法,计算二者相似度来实现词义消歧任务.在对10个典型多义词进行词义消歧的测试实验中,采用该方法取得了平均正确率为83.13%的消歧结果.
鲁松白硕黄雄
关键词:向量空间模型自然语言处理
基于描述复杂性的优化学习算法被引量:8
2002年
从描述复杂性的角度出发 ,提出了一种新的优化学习算法 .描述复杂性理论认为 ,一个数据集的最小长度描述最能体现出这个数据集的本质规律 .借鉴机器学习和认知心理学领域的研究成果 ,该文采用“规则 +例外”作为描述方法 ,从而把学习问题转化成求在“规则 +例外”描述方法下的最小长度描述的优化问题 .实验表明 ,这种算法的结果能够得到很好的解释 .
卜东波许洪波白硕
关键词:学习算法
基于向量空间模型的有导词义消歧被引量:57
2001年
词义消歧一直是自然语言理解中的一个关键问题 ,该问题解决的好坏直接关系到自然语言处理中诸多应用问题的效果优劣 .由于自然语言知识表示的困难 ,在手工规则的词义消歧难以达到理想效果的情况下 ,各种有导机器学习方法被应用于词义消歧任务中 .借鉴前人的成果引入信息检索领域中向量空间模型文档词语权重计算技术来解决多义词义项的知识表示问题 ,并提出了上下文位置权重的计算方法 ,给出了一种基于向量空间模型的词义消歧有导机器学习方法 .该方法将多义词的义项和上下文分别映射到向量空间中 ,通过计算多义词上下文向量与义项向量的距离 ,采用 k- NN(k=1)方法来确定上下文向量的义项分类 .在 9个汉语高频多义词的开放和封闭测试中均取得了突出的成绩 (封闭测试平均正确率为 96 .31% ,开放测试平均正确率为 92 .98% ) 。
鲁松白硕黄雄张健
关键词:词义消歧向量空间模型自然语言理解
聚类/分类中的粒度原理被引量:139
2002年
从信息粒度的角度来剖析聚类和分类技术 ,试图使用信息粒度原理的框架来统一聚类和分类 .从信息粒度的观点来看 ,聚类是在一个统一的粒度下进行计算 ,而分类却是在不同的粒度下进行计算 .该文还根据粒度原理设计了一种崭新的分类算法 ,在大规模中文文本分类的应用实践表明这种分类算法有较强的泛化能力 .
卜东波白硕李国杰
关键词:聚类粒度原理信息粒度粗集人工智能信息处理
汉语多重关系复句的关系层次分析被引量:31
2001年
汉语多重关系复句的句法分析问题主要由复句中的关系分析和层次分析两部分组成 .将多重关系复句中的层次分析作为研究对象 .它是针对多种逻辑或并列关系 ,按照一定层次组成复杂主从关系复句而进行的关系层次分析过程 .为了有效地形式化地表示多重关系复句的层次结构 ,提出了关系层次树的概念 ,并以此为基础构造文法 ,采用部分数据驱动的确定性移进 归约算法实现多重关系复句的关系层次分析 .通过开放测试对计算机实现的多重关系复句句法分析器进行考察 ,93.56 %的正确率使所提出的分析方法的有效性和正确性得到了充分的验证 .
鲁松白硕李素建刘群
关键词:句法分析自然语言理解
共2页<12>
聚类工具0