福建省重点科技计划项目(2006H0038)
- 作品数:6 被引量:36H指数:2
- 相关作者:史晓东郭文卢亚军陈毅东赵欣更多>>
- 相关机构:厦门大学西北民族大学更多>>
- 发文基金:福建省重点科技计划项目国家高技术研究发展计划国家自然科学基金更多>>
- 相关领域:自动化与计算机技术电子电信更多>>
- 跨语言信息检索中的查询扩展被引量:4
- 2009年
- 提出了把语义词典和马尔可夫随机域的潜在语义扩展相结合的新方法,充分利用了现有词典资源和语料库资源,又克服了单一使用词典方法的局限性和单一使用语义扩展的不确定性,扩展出查询词的同义近义词,上位词和潜在语义相关词,实验表明该方法能很好的解决跨语言信息检索中翻译项的歧义问题。
- 郭文陈毅东赵欣
- 关键词:跨语言信息检索查询扩展
- 基于HMM的汉语整句拼音输入法研究
- 2008年
- 介绍了一种基于HMM的汉语整句拼音输入转换为整句汉字的输入法,提出了引入语言知识后的一种音字选择方法,并给出了采用N元拼音文法时的选择模型。实验表明,该方法取得了较好的效果。
- 贾剑峰史晓东赖兴邦
- 关键词:智能拼音输入法N元模型
- 央金藏文分词系统被引量:30
- 2011年
- 藏文分词是藏文信息处理的一个基本步骤,该文描述了我们将一个基于HMM的汉语分词系统Segtag移植到藏文的过程,取得了91%的准确率。又在错误分析的基础上,进行了训练词性的取舍、人名识别等处理,进一步提高了准确率。
- 史晓东卢亚军
- 关键词:藏文分词自然语言处理HMM
- 基于FrameNet的汉语语义框架网络自动构造被引量:1
- 2010年
- 语义知识库是自然语言处理的基础性工程,但现阶段语义知识库的构建,大部分工作基于人工。基于英语框架网络FrameNet,采用FrameNet的现有框架库作为汉语框架网络的框架库,通过FrameNet中现有标注英文例句训练一语义角色标注器,利用英汉双语平行语料,对英文语料进行语义角色标注并将其映射到中文句子上,从标注好的汉语句子中提取汉语词元和例句填充汉语框架,构建汉语词汇库和例句库,从而实现汉语语义框架网络的自动构造。
- 龙波郭文
- 关键词:框架语义学语义角色标注
- 利用系统整合提高中文分词精度的方法研究
- 2009年
- 实现一个基于条件随机场模型的中文分词工具,同时还提出利用多系统组合来提升中文分词成绩的构想,并用实验数据分析几个系统整合后所具有的分词潜力。实现几个系统的整合并将分词最好的成绩提高0.56个百分点。
- 刘智文
- 关键词:条件随机场中文分词
- 跨语言信息检索中的查询扩展
- 本文提出了把词典和马尔可夫随机域的潜在语义扩展相结合的新方法,充分的利用了现有词典资源,又克服了单一使用词典方法的局限性和单一使用语义扩展的不确定性,扩展出查询词的同义近义词,上下位词和潜在语义相关词,实验表明该方法能比...
- 郭文史晓东陈毅东
- 关键词:跨语言信息检索查询扩展
- 文献传递
- 基于HTK的语音识别的并行化研究与实现被引量:1
- 2009年
- 详细地分析了语音识别的过程,给出了相应的算法描述,并分析了语音识别并行化的可能性。将并行计算的思想应用于语音识别的算法中,使用多线程技术,并引入避免竞争条件的机制,在多核计算机上并行地计算HMM模型节点的似然率,从而得到语音识别的并行化算法。分析了该并行化算法的性能,同时在语音识别工具包HTK 3.4上实现了这种并行化算法。基于WSJ0语料库的实验结果表明该并行化算法在不影响识别结果的前提下能够有效地提高语音识别的实时性能。
- 刘勇进史晓东
- 关键词:多核HTK并行计算语音识别