中国航空科学基金(05J54011)
- 作品数:2 被引量:50H指数:2
- 相关作者:蔡东风吕德新董燕举孙景广姚天顺更多>>
- 相关机构:沈阳航空工业学院东北大学更多>>
- 发文基金:中国航空科学基金辽宁省自然科学基金国家高技术研究发展计划更多>>
- 相关领域:自动化与计算机技术更多>>
- 知网在文本分割算法中的应用
- 文本分割在信息检索、信息获取、自动文摘等领域中起着重要作用。目前已有文本分割方法大多只利用了文本表层的词汇重现信息,分割效果并不理想。本文在 TextTiling 算法的基础上,通过分析分割结果, 发现仅利用词汇重现信息...
- 朱海军张桂平蔡东风王炜华
- 关键词:文本分割知网
- 基于知网的中文问题自动分类被引量:49
- 2007年
- 问答系统应能用准确、简洁的答案回答用户用自然语言提出的问题。问题分类是问答系统所要处理的第一步,分类结果的正确率直接影响后续工作的进行。本文提出了一种使用知网作为语义资源选取分类特征,并使用最大熵模型进行分类的新方法。该方法以问题的疑问词、句法结构、疑问意向词、疑问意向词在知网中的首义原作为分类特征。实验结果表明,在知网中选取的首义原能很好的表达问题焦点词的语义信息,可作为问题分类的一个主要特征。该方法能显著地提高问题分类的精度,大类和小类的分类精度分别达到了92.18%和83.86%。
- 孙景广蔡东风吕德新董燕举
- 关键词:计算机应用中文信息处理问答系统知网最大熵模型
- 双语知识库中关联实例的多策略提取机制被引量:2
- 2007年
- 双语库是翻译记忆系统最重要的组成部分之一。从有限规模的双语库中提取更多的符合用户当前翻译需要的关联实例是翻译记忆技术研究的主要内容,本文首先对当前基于单一方法的实例检索算法存在的局限性进行了分析,并在对双语库进行知识化表示的基础上,提出了基于多策略的关联实例提取机制,即综合运用句子句法结构匹配、句子编辑距离计算、句子短语片段匹配、词汇语义泛化、基于扩展信息(如:句子来源、所属专业、应用频度等信息)的优选等策略进行关联实例提取。试验结果表明,该方法有效提高了关联实例的召回数量和质量,明显改善了对用户的辅助效果。
- 张桂平姚天顺尹宝生蔡东风宋彦
- 关键词:人工智能机器翻译翻译记忆
- 科技论文的标题识别
- 科技论文的结构可以通过文中的小标题进行分析,但小标题的种类繁多、格式多样,给计算机的识别带来一定的困难。本文在识别有数字标号的标题时,对单纯的数字识别法进行了改进,并提出一种基于特征词的识别法,用于识别没有数字标号的标题...
- 朱海军张桂平蔡东风王炜华
- 文献传递