国家自然科学基金(60573189)
- 作品数:4 被引量:6H指数:1
- 相关作者:郭文陈毅东赵欣龙波刘勇进更多>>
- 相关机构:厦门大学更多>>
- 发文基金:福建省重点科技计划项目国家自然科学基金国家高技术研究发展计划更多>>
- 相关领域:自动化与计算机技术更多>>
- 跨语言信息检索中的查询扩展被引量:4
- 2009年
- 提出了把语义词典和马尔可夫随机域的潜在语义扩展相结合的新方法,充分利用了现有词典资源和语料库资源,又克服了单一使用词典方法的局限性和单一使用语义扩展的不确定性,扩展出查询词的同义近义词,上位词和潜在语义相关词,实验表明该方法能很好的解决跨语言信息检索中翻译项的歧义问题。
- 郭文陈毅东赵欣
- 关键词:跨语言信息检索查询扩展
- 基于HTK的语音识别的并行化研究与实现被引量:1
- 2009年
- 详细地分析了语音识别的过程,给出了相应的算法描述,并分析了语音识别并行化的可能性。将并行计算的思想应用于语音识别的算法中,使用多线程技术,并引入避免竞争条件的机制,在多核计算机上并行地计算HMM模型节点的似然率,从而得到语音识别的并行化算法。分析了该并行化算法的性能,同时在语音识别工具包HTK 3.4上实现了这种并行化算法。基于WSJ0语料库的实验结果表明该并行化算法在不影响识别结果的前提下能够有效地提高语音识别的实时性能。
- 刘勇进史晓东
- 关键词:多核HTK并行计算语音识别
- 提高广义LR分析器的效率
- 本文提出了提高广义LR句法分析算法效率的一些措施,包括采用适当的数据结构、提高移进和归约操作效率、快速重复弧检测等,使得其在分析自然语言方面达到非常高的效率,以解除基于句法分析的多个自然语言处理应用的瓶颈问题。本文描述的...
- 史晓东
- 文献传递
- 基于语篇的机器翻译前瞻
- 1 引论近年来,统计机器翻译研究持续升温,多个统计机器翻译系统在以NIST为代表的评测中全面超越传统的基于规则的系统。许多人(包括著名的统计机器翻译专家Keyin Knight) 认为,达到类似人的翻译质量的机器翻译系统...
- 史晓东陈毅东
- 文献传递
- 基于FrameNet的汉语语义框架网络自动构造被引量:1
- 2010年
- 语义知识库是自然语言处理的基础性工程,但现阶段语义知识库的构建,大部分工作基于人工。基于英语框架网络FrameNet,采用FrameNet的现有框架库作为汉语框架网络的框架库,通过FrameNet中现有标注英文例句训练一语义角色标注器,利用英汉双语平行语料,对英文语料进行语义角色标注并将其映射到中文句子上,从标注好的汉语句子中提取汉语词元和例句填充汉语框架,构建汉语词汇库和例句库,从而实现汉语语义框架网络的自动构造。
- 龙波郭文
- 关键词:框架语义学语义角色标注
- 利用系统整合提高中文分词精度的方法研究
- 2009年
- 实现一个基于条件随机场模型的中文分词工具,同时还提出利用多系统组合来提升中文分词成绩的构想,并用实验数据分析几个系统整合后所具有的分词潜力。实现几个系统的整合并将分词最好的成绩提高0.56个百分点。
- 刘智文
- 关键词:条件随机场中文分词
- 跨语言信息检索中的查询扩展
- 本文提出了把词典和马尔可夫随机域的潜在语义扩展相结合的新方法,充分的利用了现有词典资源,又克服了单一使用词典方法的局限性和单一使用语义扩展的不确定性,扩展出查询词的同义近义词,上下位词和潜在语义相关词,实验表明该方法能比...
- 郭文史晓东陈毅东
- 关键词:跨语言信息检索查询扩展
- 文献传递
- 语篇标注语料库的建设研究
- 本文主要介绍一个语篇标注体系,该标注体系采用自底向上的方法对基本语篇形式单元(BFDU)到句群等语篇中不同层次的语言单位和其间的关系类型进行标注,并标注了能充分反应语篇信息的各种词汇关系。本研究所产生的语料库可用于基于语...
- 练睿婷史晓东
- 关键词:语料库
- 文献传递
- Incorporating Syntax-Based Language Models in Phrase-Based SMT Models
- In this paper,we proposed a method to incorporate syntax-based language models in phrase-based statistical mac...
- Yidong CHEN
- 厦门大学第四届全国机器翻译研讨会评测系统描述
- 本文描述了厦门大学智能科学与技术系参加第四届全国机器翻译研讨会机器翻译评测的系统。文章分别对参加评测的各翻译系统的概况以及所使用的系统融合技术做了介绍,并详细描述了参与测计中的数据配置情况和结果。
- 陈毅东史晓东周昌乐
- 关键词:统计机器翻译
- 文献传递