您的位置: 专家智库 > >

李正华

作品数:12 被引量:95H指数:5
供职机构:哈尔滨工业大学更多>>
发文基金:国家自然科学基金国家高技术研究发展计划国家科技支撑计划更多>>
相关领域:自动化与计算机技术语言文字经济管理更多>>

文献类型

  • 5篇期刊文章
  • 4篇会议论文
  • 3篇学位论文

领域

  • 11篇自动化与计算...
  • 1篇经济管理
  • 1篇语言文字

主题

  • 5篇依存句法分析
  • 5篇中文
  • 5篇句法分析
  • 4篇中文信息
  • 3篇信息处理
  • 3篇中文信息处理
  • 2篇语言
  • 2篇语言处理
  • 2篇树库
  • 2篇搜索
  • 2篇自然语言
  • 2篇自然语言处理
  • 2篇可视化
  • 2篇基于XML
  • 2篇计算机
  • 2篇计算机应用
  • 1篇单复数
  • 1篇短语
  • 1篇短语结构
  • 1篇信息检索

机构

  • 12篇哈尔滨工业大...
  • 1篇北京拓尔思信...

作者

  • 12篇李正华
  • 9篇刘挺
  • 8篇车万翔
  • 1篇郎君
  • 1篇秦兵
  • 1篇李生

传媒

  • 3篇中文信息学报
  • 1篇自动化学报
  • 1篇智能计算机与...
  • 1篇第四届全国学...
  • 1篇第五届全国青...
  • 1篇中国中文信息...
  • 1篇第五届全国青...

年份

  • 1篇2018
  • 2篇2013
  • 2篇2011
  • 3篇2010
  • 4篇2008
12 条 记 录,以下是 1-10
排序方式:
短语结构树库向依存结构树库转化研究被引量:13
2008年
汉语依存树库的建设相对其他语言如英语,在规模和质量上还有一些差距。树库标注需要付出很大的人力物力,并且保证树库质量也比较困难。该文尝试通过规则和统计相结合的方法,将宾州汉语短语树库PennChinese Treebank转化为哈工大依存树库HIT-IR-CDT的体系结构,从而增大现有依存树库的规模。将转化后的树库加入HIT-IR-CDT,训练和测试依存句法分析器的性能。实验表明,加入少量经转化后的树库后,依存句法分析器的性能有所提高;但加入大量树库后,性能反而下降。经过细致分析,作为一种利用多种树库提高依存句法分析器性能的方法,短语转依存还存在很多需要深入研究的方面。
李正华车万翔刘挺
关键词:计算机应用中文信息处理依存句法分析
中文人称名词短语单复数自动识别被引量:5
2008年
名词短语的单复数信息在共指消解中是必不可少的特征.与英语不同,中文属于汉藏语系,名词本身不能明显体现单复数信息,需要借助其所在的名词短语来进行体现.本文在自动内容抽取(Automatic content extraction,ACE)语料上抽取得到人称名词短语的单复数信息,分别采用了基于规则和机器学习的方法来进行人称名词短语的单复数自动识别,基于规则的方法,在一些知识资源的基础上定义了规则模板库,每条规则采用槽和槽值的方法米进行体现;机器学习方法采用最大熵模型组合考察了词形、词性、词义、数量关系等特征.两种方法分别达到了48.24%和87.48%的正确率.实验结果显示,基于规则的方法能够保证精确率而不能保证召回率,机器学习的方法可以更好地完成单复数信息的识别任务.
郎君秦兵刘挺李正华李生
关键词:单复数
语言技术平台被引量:47
2011年
中文信息处理不仅需要基础数据平台的支撑,而且需要基础技术平台的支撑。该文介绍了我们历经八年研制并不断改进的语言技术平台LTP(Language Technology Platform)。该平台包括中文词法分析、句法分析以及语义分析等多项中文处理技术,其中的句法语义分析技术在CoNLL 2009国际评测中获得第一名的成绩。该平台自2006年起对学术界免费共享,2010年获得中国中文信息学会"钱伟长中文信息处理科学技术奖一等奖",目前已有400多家国内外研究机构签约共享该平台。2011年6月,该平台开放源代码,同行们不仅可以利用该平台的结果进行上层技术研究,而且可以和我们一起改进该平台本身。
刘挺车万翔李正华
关键词:中文信息处理
高铁时空压缩效应对风险投资行为的影响研究
近年来,伴随着我国高铁建设规模的不断扩大,逐步完善的高铁网络促进各城市经济主体间建立更加紧密和频繁的联系,影响了资本配置的布局,尤其影响着具有较强“本地偏好”风险资本的投资行为。高铁的开通压缩了高铁城市间的时空距离,不仅...
李正华
关键词:高铁风险投资
文献传递
语言技术平台
中文信息处理不仅需要基础数据平台的支撑,而且需要基础技术平台的支撑。该文介绍了我们历经八年研制并不断改进的语言技术平台LTP(LanguageTechnology Platfom)。该平台包括中文词法分析、句法分析以度语...
刘挺车万翔李正华
关键词:中文信息自然语言处理
文献传递
基于XML的语言技术平台
本文提出了一个基于XML数据表示的中文自然语言处理框架:语言技术平台(LanguageTechnology Platform,LTP)。LTP包括六个组成部分:基于LTML(Language Technology Mar...
李正华车万翔刘挺
关键词:可视化
文献传递
依存句法分析统计模型及树库转化研究
句法分析的任务是根据给定的语法,自动推导出句子的语法结构。句法分析性能的提高将对信息检索、信息抽取以及机器翻译等应用产生重要的推动作用。在句法分析的研究中,依存语法以其形式简洁、易于标注、便于应用等优点,逐渐受到研究人员...
李正华
关键词:信息检索
文献传递
短语结构树库向依存结构树库转化研究
汉语依存树库建设相对其他语言如英语,在规模和质量上还有一些差距,树库标注需要付出很大的人力物力,并且保证树库质量也比较困难。 本文通过规则和统计相结合的方法,将短语树库Penn Chinese Treebank...
李正华车万翔刘挺
关键词:汉字处理短语结构数理语言学
文献传递
基于柱搜索的高阶依存句法分析被引量:12
2010年
该文提出使用所有的孙子节点构成祖孙特征的高阶依存模型,并且使用柱搜索策略限制搜索空间,最终找到近似最优依存树。另外,该文以较小的时间复杂度为代价,使用了丰富的依存关系特征,并且允许模型在解码的过程中进行依存关系选择。作者参加了CoNLL 2009年多语依存句法分析和语义角色标注国际评测,最终获得联合任务总成绩第一名,依存句法分析总成绩第三名。
李正华车万翔刘挺
关键词:计算机应用中文信息处理依存分析
基于XML的语言技术平台
本文提出了一个基于XML数据表示的中文自然语言处理框架:语言技术平台(LanguageTechnology Platform,LTP)。LTP包括六个组成部分:基于LTML(Language Technology Mar...
李正华车万翔刘挺
关键词:可视化
文献传递
共2页<12>
聚类工具0