您的位置: 专家智库 > >

张勇

作品数:14 被引量:49H指数:3
供职机构:华中师范大学计算机学院计算机科学系更多>>
发文基金:国家自然科学基金教育部科学技术研究重点项目国家社会科学基金更多>>
相关领域:自动化与计算机技术语言文字电子电信更多>>

文献类型

  • 8篇会议论文
  • 6篇期刊文章

领域

  • 12篇自动化与计算...
  • 2篇电子电信
  • 2篇语言文字

主题

  • 5篇抽取
  • 4篇子串
  • 3篇中文
  • 3篇中文信息
  • 3篇自动抽取
  • 3篇聚类
  • 2篇增量聚类
  • 2篇自动文摘
  • 2篇网络
  • 2篇网络生存
  • 2篇网络生存周期
  • 2篇文摘
  • 2篇无线传感
  • 2篇无线传感器
  • 2篇无线传感器网
  • 2篇无线传感器网...
  • 2篇互信息
  • 2篇加权
  • 2篇加权分簇算法
  • 2篇分簇

机构

  • 14篇华中师范大学
  • 2篇清华大学
  • 1篇广西科技大学
  • 1篇福建师范大学

作者

  • 14篇张勇
  • 8篇何婷婷
  • 3篇瞿国忠
  • 3篇胡文敏
  • 2篇李立
  • 2篇龚海军
  • 2篇胡珀
  • 1篇郭攀
  • 1篇陈龙
  • 1篇吴保珍
  • 1篇张勇
  • 1篇王萌
  • 1篇徐超
  • 1篇李鹏

传媒

  • 2篇计算机工程
  • 1篇计算机应用
  • 1篇计算机应用研...
  • 1篇中文信息学报
  • 1篇高等函授学报...
  • 1篇2008中国...
  • 1篇全国第八届计...
  • 1篇2008中国...
  • 1篇第九届全国计...
  • 1篇全国第八届计...

年份

  • 1篇2010
  • 1篇2009
  • 3篇2008
  • 4篇2007
  • 2篇2006
  • 3篇2005
14 条 记 录,以下是 1-10
排序方式:
基于卡方检验的汉语术语抽取被引量:15
2007年
发现术语在中文信息处理和语言学习方面具有非常重要的作用和意义。提出了一种基于卡方检验的汉语术语抽取方法:先从网络上下载语料,然后使用改进的互信息参数(F-M I)抽取结构简单的质串,并在其基础上进一步使用卡方检验结合质子串分解方法抽取具有复杂结构的合串。实验结果显示,该算法有效地提高了汉语术语抽取的精确度。
胡文敏何婷婷张勇
关键词:卡方检验互信息
基于全切分获取网络流行语方法研究被引量:3
2009年
利用统计和规则相结合的算法从互联网的动态信息流中提取网络流行语。在利用全切分算法获取候选词集的基础上,依次对候选词集进行三次过滤:首先基于向量空间模型的权重过滤,运用语言模型进行过滤;然后利用垃圾串过滤规则获取网络流行词语候选词集;最后利用提出的流行词语评分模型进行筛选得到网络流行词语。实验表明,在不影响流行词语准确率的前提下,利用该方法自动获取网络流行词语的速度明显提高。
吴保珍何婷婷李立张勇张勇
关键词:中文信息处理全切分
基于质子串分解的中文术语自动抽取被引量:26
2006年
针对中文术语构成特点,提出了一种基于质子串分解的术语自动抽取方法,将词分为2类:结构简单的质词和有复杂结构的合词;使用参数F-MI抽取结构简单的质词;并在其基础上,进一步使用质子串分解方法抽取具有复杂结构的合词。实验结果显示,该算法有效地提高了中文自动术语抽取的精确度。目前该算法已在国家网络媒体监测项目中得到了应用,并显示了良好的效果。
何婷婷张勇
关键词:术语自动抽取互信息
基于质子串分解的网络新词汇自动抽取
针对中文词汇构成特点,本文提出了一种基于质子串分解的网络新词汇自动识别方法。我们从Internet上采集网页,使用改进的互信息参数(F-MI)抽取结构简单的词汇(质词):并在其基础上,进一步使用质子串分解方法抽取具有复杂...
张勇何婷婷
文献传递
标点符号的发生发展与书面化内容和方法的嬗变被引量:3
2005年
书面化内容和方法的嬗变是促使标点符号发生发展的重要因素。商代及以前,使用表现法与意合法表现由具象的基本单位粘合而成的连整体性内容,决定了标点符号只能处于萌芽状态。周代至“五四”时期,使用表现、记录兼用法与意合、音合兼用法表现或记录日益抽象化、松散化的整体性内容,为旧式标点符号的产生提供了需要和土壤。“五四”至今,更大比例地使用记录法和音合法记录或表现更加抽象化、松散化同时在情绪义等方面又有所新增的整体性内容,一定程度上促成了旧式标点符号发展至今广义性标点符号。
郭攀张勇
关键词:标点符号书面化嬗变
基于文档扩展的中文信息检索系统
本文介绍了我们参加国际信息检索比赛 NTCIR 中所使用的方法。我们首先利用传统的伪相关扩展方法检索文档,得到单个文档与查询之间的相似度:然后将前 n 篇文档聚类,再次计算类别与查询之间的相似度,并将它赋给该类别中的每一...
李立何婷婷瞿国忠张勇
关键词:聚类信息检索
文献传递
基于网络化数据挖掘策略的中文多文档自动文摘研究
多文档自动文摘是近期自然语言处理领域的一项热点研究课题。文中提出了一种基于网络化数据挖掘策略的中文多文档自动文摘方法,该方法的特色在于生成的摘要具有全面而简洁的特性,其内容能同时获得主题覆盖和冗余之间的平衡。考虑到同一主...
胡珀何婷婷张勇
关键词:多文档自动文摘
文献传递
基于质子串分解的网络新词汇自动抽取
针对中文词汇构成特点,本文提出了一种基于质子串分解的网络新词汇自动识别方法.我们从Internet上采集网页,使用改进的互信息参数(F-MI)抽取结构简单的词汇(质词);并在其基础上,进一步使用质子串分解方法抽取具有复杂...
张勇何婷婷
文献传递
一种能量有效的无线传感器网络加权分簇算法
为了解决分簇算法中网络节点能量负载问题,提出了一种能量有效的加权分簇算法算法。算法通过对节点权值的计算决定其是否出任簇头,实现整个网络的能量消耗更加均衡,最大限度地延长网络生命周期的目的。仿真实验结果表明,新的分簇算法能...
张勇
关键词:无线传感器网络加权分簇算法网络生存周期
文献传递
热点事件发现(英文)
每年都会有一些机构通过媒体发布当年的热点事件,这些事件通常都是由人工进行筛选。本文提出一种方法来自动地发现热点事件。使用从门户网站上下载下来的2006年的新闻网页,通过增量聚类得到每月的临时事件。再将各个月临时事件列表里...
何婷婷龚海军胡文敏瞿国忠张勇
关键词:增量聚类
文献传递
共2页<12>
聚类工具0