您的位置: 专家智库 > >

国家自然科学基金(60575041)

作品数:6 被引量:7H指数:2
相关作者:赵铁军梁颖红曹军王浩畅谭红叶更多>>
相关机构:哈尔滨工业大学东北林业大学苏州市职业大学更多>>
发文基金:国家自然科学基金国家高技术研究发展计划黑龙江省博士后基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 6篇期刊文章
  • 3篇会议论文

领域

  • 9篇自动化与计算...

主题

  • 3篇向量
  • 2篇多文档
  • 2篇信息处理
  • 2篇语言处理
  • 2篇文档
  • 2篇BLOG
  • 1篇多文档文摘
  • 1篇多文档摘要
  • 1篇隐马尔科夫模...
  • 1篇语言
  • 1篇语言学
  • 1篇支持向量
  • 1篇支持向量机
  • 1篇特征向量
  • 1篇爬行器
  • 1篇排序
  • 1篇自举
  • 1篇自然语言
  • 1篇自然语言处理
  • 1篇自适

机构

  • 4篇哈尔滨工业大...
  • 2篇教育部
  • 1篇东北林业大学
  • 1篇苏州市职业大...

作者

  • 6篇赵铁军
  • 3篇郑德权
  • 1篇于浩
  • 1篇谭红叶
  • 1篇赵华
  • 1篇张姝
  • 1篇赵纪元
  • 1篇刘鹏远
  • 1篇曹军
  • 1篇陈晨
  • 1篇梁颖红
  • 1篇王浩畅
  • 1篇李晗静
  • 1篇李世奇
  • 1篇朴星海
  • 1篇姚超
  • 1篇丁伟莉
  • 1篇张迪

传媒

  • 1篇电子与信息学...
  • 1篇高技术通讯
  • 1篇计算机工程与...
  • 1篇Journa...
  • 1篇Journa...
  • 1篇计算机技术与...
  • 1篇第三届学生计...

年份

  • 1篇2009
  • 4篇2008
  • 4篇2006
6 条 记 录,以下是 1-9
排序方式:
面向Blog的网络爬行器设计与实现
随着一种新的信息管理和发布工具逐渐被大家认识和使用,互联网的“个人门户”时代已经迎面走来,这种新的信息组织和传播方式,就是Blog。本文针对Blog领域,设计并实现了一个面向Blog的网络爬行器。与通用爬行器相比,具有面...
朴星海赵铁军郑德权张迪
关键词:爬行器BLOG
文献传递
汉语空间关系中射体识别问题的研究与分析
本文利用了在汉语的空间关系表达中射体的概念,结合语料和统计数据详细分析了射体的语法、语义、结构特点以及特殊用法。在此基础上提出了基于Winnow算法的射体识别策略,并结合射体的语言特点,给出了一套较为完整的特征方案。实验...
赵纪元李晗静赵铁军
文献传递
Chinese Information Processing and Its Prospects被引量:1
2006年
李生赵铁军
关键词:信息处理语言处理计算语言学
文本语块识别典型方法的比较与分析被引量:3
2008年
文本语块识别在自然语言处理领域具有重要作用。以WINNOW、支持向量机和感知器三种典型的语块识别方法为对象,从模型和特征两方面对每种方法进行了剖析,并比较和分析了三种方法与隐马尔科夫模型的优缺点,指出如果为了避免数据稀疏而只采用"词性"特征来识别多种语块,那些对于"词"敏感的短语准确率将会很低。因此针对不同的语块采用不同的特征和策略,不同短语的识别相互借鉴,把不同语块的识别集成在一起,将会起到很好的效果。
梁颖红曹军
关键词:支持向量机感知器WINNOW隐马尔科夫模型
多文档文摘句子优选算法研究被引量:1
2008年
该文通过对文摘句的选择问题进行分析,提出了一种文摘句优选方法,相对于传统的逐个添加句子生成文摘的方法,该文提出的方法是在一定范围内逐个删除句子生成文摘。该方法分两阶段进行句子选择,第1阶段获取候选文摘句子集合,采用了直接获取算法和基于冗余信息处理的获取算法。第2阶段逐步删除句子,分别以不同特征项作为衡量句子对候选文摘句子集合的贡献,提出了文摘句优选算法。以DUC2004为实验语料,通过经句子选择后生成文摘的ROUGE得分,验证了句子选择在文摘生成过程中的必要性,与基于冗余信息处理的句子选择方法比较,验证了该文提出算法的有效性。
张姝赵铁军姚超郑德权
关键词:多文档文摘
基于向量相似度计算的半监督的名实体识别被引量:2
2008年
提出一种基于向量相似度计算的半监督的NER方法,主要思想是:首先利用bootstrapping方法获取NER所需的各种特征;然后将待测实例表示为实例特征向量,每一类名实体表示为类特征向量;最后根据每个类特征向量与实例特征向量的相似度进行分类。在人民日报语料上选取疾病名、武器名、交通工具名进行相关测试,F测度分别为:77.4%,66.1%和73.1%,结果令人满意。
谭红叶赵铁军王浩畅
关键词:特征向量半监督学习自举
基于ART网络的无指导中文共指消解方法
2009年
提出了一种基于自适应谐振理论(ART)网络的无指导中文名词短语共指消解方法。该方法充分利用名词短语自身特征,通过改变网络参数动态调节聚类数量,有效地解决了目前聚类共指消解中输出类别数目难以确定的难题。另外采用了一种基于信息增益率的特征选择方法,减少了区分度较弱特征给聚类所带来的干扰。该方法在保证了识别正确率的前提下,不依赖人工标注语料,可直接应用于跨领域的真实文本。最后在ACE中文语料上进行了相关实验,并取得了较好的结果。
李世奇赵铁军陈晨刘鹏远
关键词:共指消解无指导学习自然语言处理
中文Blog热门话题检测与排序技术研究
Blog(博客)作为一种全新的网络发布模式,在很大程度上增强了网络信息的开放性,也使得Blog空间里的信息量成倍增长。利用话题检测技术将Blog文本信息按照所表达的话题进行归类和组织,可以使用户在这种动态变化的环境下查看...
丁伟莉赵华郑德权赵铁军于浩
关键词:BLOG向量空间模型相似度
文献传递
TWO-STAGE SENTENCE SELECTION APPROACH FOR MULTI-DOCUMENT SUMMARIZATION
2008年
Compared with the traditional method of adding sentences to get summary in multi-document summarization,a two-stage sentence selection approach based on deleting sentences in acandidate sentence set to generate summary is proposed,which has two stages,the acquisition of acandidate sentence set and the optimum selection of sentence.At the first stage,the candidate sentenceset is obtained by redundancy-based sentence selection approach.At the second stage,optimum se-lection of sentences is proposed to delete sentences in the candidate sentence set according to itscontribution to the whole set until getting the appointed summary length.With a test corpus,theROUGE value of summaries gotten by the proposed approach proves its validity,compared with thetraditional method of sentence selection.The influence of the token chosen in the two-stage sentenceselection approach on the quality of the generated summaries is analyzed.
Zhang Shu Zhao Tiejun Zheng Dequan Zhao Hua
关键词:文字信息处理文本处理多文档摘要
共1页<1>
聚类工具0