您的位置: 专家智库 > >

国家自然科学基金(60873128)

作品数:23 被引量:124H指数:7
相关作者:李济洪王瑞波李国臣王钰宋毅君更多>>
相关机构:山西大学太原工业学院北京大学更多>>
发文基金:国家自然科学基金国家社会科学基金国家高技术研究发展计划更多>>
相关领域:自动化与计算机技术理学文化科学更多>>

文献类型

  • 17篇期刊文章
  • 1篇会议论文

领域

  • 12篇自动化与计算...
  • 6篇理学

主题

  • 3篇语义
  • 3篇语义角色
  • 3篇语义角色标注
  • 3篇散度
  • 3篇散度效应
  • 3篇色标
  • 3篇角色标注
  • 2篇信息处理
  • 2篇正交
  • 2篇正交表
  • 2篇似然
  • 2篇似然估计
  • 2篇随机场
  • 2篇随机场模型
  • 2篇条件随机场
  • 2篇条件随机场模...
  • 2篇中文
  • 2篇中文信息
  • 2篇中文信息处理
  • 2篇中文阅读

机构

  • 18篇山西大学
  • 3篇太原工业学院
  • 1篇北京大学

作者

  • 15篇李济洪
  • 7篇王瑞波
  • 6篇李国臣
  • 5篇王钰
  • 3篇宋毅君
  • 2篇刘开瑛
  • 1篇家会臣
  • 1篇张娜
  • 1篇张星
  • 1篇杨杏丽
  • 1篇冯霞
  • 1篇杨柳
  • 1篇任改仙
  • 1篇谷波
  • 1篇李补喜
  • 1篇李茹
  • 1篇王凯华
  • 1篇王蔚林
  • 1篇高亚慧
  • 1篇张明

传媒

  • 6篇中文信息学报
  • 2篇应用数学学报
  • 2篇应用概率统计
  • 2篇太原师范学院...
  • 1篇系统科学与数...
  • 1篇计算机研究与...
  • 1篇实验技术与管...
  • 1篇计算机科学
  • 1篇中北大学学报...

年份

  • 1篇2016
  • 2篇2014
  • 1篇2013
  • 1篇2012
  • 3篇2011
  • 4篇2010
  • 5篇2009
  • 1篇2008
23 条 记 录,以下是 1-10
排序方式:
基于条件随机场模型的汉语功能块自动标注被引量:8
2010年
汉语组块分析是将汉语句子中的词首先组合成基本块,进一步组合形成句子的功能块,最终形成一个具有层次组合结构的汉语句法描述结构.将汉语功能块的自动标注问题看作序列标注任务,并使用词和基本块作为标注单元分别建立标注模型.针对不同的标注模型,分别构建基本块层面的特征集合,并使用条件随机场模型进行汉语功能块的自动标注.实验数据来自清华大学TCT语料库,并且按照8∶2的比例切分形成训练集和测试集.实验结果表明,与仅使用词层面信息的标注模型相比,基本块特征信息的适当加入可以显著提高功能块标注性能.当使用人工标注的基本块信息时,汉语功能块自动标注的准确率达到88.47%,召回率达到89.93%,F值达到89.19%.当使用自动标注的基本块信息时,汉语功能块的标注的准确率为84.27%,召回率为85.57%,F值为84.92%.
李国臣王瑞波李济洪
关键词:条件随机场模型句法分析
一种高维空间中中位数距离的证明
2009年
在统计学习理论中,最近邻法是一种非常直观,重要的学习方法,但是在高维空间中由于"维数灾难"问题,该方法将失效.一种重要的表现形式就是稀疏抽样使得所有样本点都靠近样本的边沿,而不是最近邻样本点.文献[1]中定义的一种中位数距离可以给出它的一个量化的度量,文章从统计的角度对该距离进行了阐述和证明.
王蔚林李济洪王钰
关键词:高维空间最近邻法
两水平无重复因析试验散度效应的估计被引量:3
2010年
本文对两水平无重复因析试验给出了散度效应的一种新的估计,称为AMH估计,改进了文献中散度效应的较好的MH估计的一个缺陷,给出并证明了AMH估计的无偏条件,证明了AMH估计比MH估计有更小的方差下界.最后通过模拟试验比较了AMH和MH估计的偏度,方差和均方误差.
李济洪王钰张星
关键词:均方误差
汉语框架自动识别中的歧义消解被引量:10
2011年
该文研究了汉语框架自动识别中的歧义消解问题,即对给定句子中的目标词,基于其上下文环境,从现有的框架库中,为该目标词自动标注一个合适的框架。该文将此任务看作分类问题,使用最大熵建模,选用词、词性、基本块、依存句法树上的若干特征,并使用开窗口技术和BOW策略,以目前汉语框架语义知识库中的88个词元的2 077条例句为训练、测试语料,进行了3-fold交叉验证实验,最好结果取得69.28%的精确率(Accuracy)。
李济洪高亚慧王瑞波李国臣
关键词:框架语义最大熵模型
汉语框架语义角色的自动标注研究进展
在给定句子中目标词及其所属框架的前提下,本文以词为标注单位,将语义角色标注形式化为词序列标注问题,分别使用条件随机场和最大熵模型,基于山西大学的CFN语料库,研究汉语框架语义角色的自动标注。本文选取词、词性、位置以及它们...
李济洪王瑞波王蔚林杨杏丽高亚慧李国臣谷波
关键词:语义角色标注正交表
文献传递
汉语框架语义网构建及其应用技术研究被引量:23
2011年
汉语框架语义网(Chinese FrameNet,CFN)是一个以Fillmore的框架语义学为理论基础、以英文FrameNet为参照、以汉语语料事实为依据的供计算机使用的汉语词汇语义数据库。该文首先介绍了汉语框架语义网的构建基础——框架语义学以及英语的框架语义网工程,然后具体分析了汉语框架语义网的构建技术,并对基于汉语框架网的语义角色自动标注研究进行了介绍,25个框架的交叉验证的实验结果的准确率、召回率、F1-值分别达到74.16%,52.70%,61.62%;最后,介绍了几个基于汉语框架语义网的研究课题的进展情况。
刘开瑛
关键词:语义角色标注
截尾线性回归模型参数极大似然估计的存在性和唯一性被引量:1
2009年
考虑带有截尾数据的线性回归模型,在较为一般的截尾数据情形下,本文给出了其参数极大似然估计(MLE)存在且唯一的充分必要条件,且对MLE不存在的样本数据集Q的描述定义更为准确.
李济洪杨柳王钰
关键词:极大似然估计存在性唯一性
带有不完全信息随机截尾试验下最大似然估计的重对数律被引量:11
2009年
本文在条件(Φ)下,证明了带有不完全信息随机截尾试验下最大似然估计的收敛速度符合重对数律,并验证了Weibull分布、对数正态分布满足条件(Φ).
宋毅君李补喜李济洪
关键词:最大似然估计重对数律
基于规则的中文阅读理解问题回答技术研究被引量:1
2009年
该文针对中文阅读理解问答中的时间、人物、地点、数值、实体、描述六类问题,制定了各类问题回答的启发式规则集。对规则集中每条规则赋予一个相应权值,利用正交表对各规则所对应的权值进行了调优选取,给出了各候选答案句基于相应规则的得分计算方法。该文方法在山西大学自主开发的中文阅读理解语料库CRCC v1.1上进行了实验,在整个语料库上得到了83.09%的HumSent准确率。为了与文献[10]中的最大熵方法比较,该文在与文献[10]中完全相同的训练集上调优规则的权值,在相同的测试集上测试,最终得到HumSent准确率81.13%,比最大熵的方法高大约1%,且在全部的六类问题上,该文方法的HumSent准确率都不低于最大熵方法。
李济洪杨杏丽王瑞波张娜李国臣
关键词:计算机应用中文信息处理问答系统正交表
建设统一虚拟化教学环境平台的探索被引量:20
2016年
在对传统实验室架构以及存在问题进行分析的基础上,探讨了运用服务器虚拟化与桌面虚拟化技术搭建校级虚拟化教学环境平台的架构及其优势。结合山西大学统一虚拟化教学环境实验中心的建设,提出搭建校级虚拟化教学环境平台需要注意的几个关键问题:(1)满足高并发要求,以避免启动风暴;(2)架构要具有可扩展性;(3)要支持各种类型端口的外设;(4)虚拟桌面连接选择不依赖桌面操作系统内部代理程序的方案;(5)能够支持差异更新。
宋毅君张明
关键词:服务器虚拟化桌面虚拟化
共2页<12>
聚类工具0