您的位置: 专家智库 > >

国家重点实验室开放基金(SKLSDE-2011KF-0X)

作品数:5 被引量:19H指数:3
相关作者:成卫青杨晶郭常忠张姗姗豆仁福更多>>
相关机构:南京邮电大学烟台大学中国人民解放军95856部队更多>>
发文基金:国家重点实验室开放基金江苏省自然科学基金国家自然科学基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 5篇中文期刊文章

领域

  • 5篇自动化与计算...

主题

  • 1篇信息抽取
  • 1篇应用类
  • 1篇应用类型
  • 1篇用户
  • 1篇用户兴趣
  • 1篇用户兴趣模型
  • 1篇余度
  • 1篇语义
  • 1篇正则
  • 1篇正则表达式
  • 1篇知网
  • 1篇中介真值程度
  • 1篇冗余
  • 1篇冗余度
  • 1篇识别方法
  • 1篇主观
  • 1篇网络
  • 1篇相似度
  • 1篇相似度算法
  • 1篇向量

机构

  • 5篇南京邮电大学
  • 1篇烟台大学
  • 1篇中国人民解放...

作者

  • 5篇成卫青
  • 2篇杨晶
  • 1篇黄卫东
  • 1篇郭常忠
  • 1篇杨哲睿
  • 1篇杨龙
  • 1篇吴旭东
  • 1篇于静
  • 1篇豆仁福
  • 1篇张姗姗

传媒

  • 4篇计算机技术与...
  • 1篇南京邮电大学...

年份

  • 2篇2013
  • 3篇2012
5 条 记 录,以下是 1-5
排序方式:
改进的主客观结合的词语语义相似度算法被引量:1
2012年
鉴于词语表达形式与词语语义的多样性,词语语义相似度计算是自然语言处理、智能检索、文档聚类等领域的一个研究热点。文中根据词语表达方式的特点,在基于词语语义词典和基于大规模语料库这两种计算词语语义相似度方法的基础之上,提出一种改进的主观和客观相结合的词语相似度计算方法。从方法论的角度,本算法既融合了主观经验主义思想也融合了客观的理性主义思想,使得词语语义相似度的计算结果能够更加准确。实验结果表明采用文方法是有效的,能够显著提高词语语义相似度计算结果的准确性。
吴旭东成卫青黄卫东
关键词:知网
基于对等结点指针表优化的Chord算法改进被引量:5
2012年
对等网络需要解决的一个关键性问题是如何有效地查找存储所需资源的结点。文中在研究分布式查找算法Chord的基础上,介绍了分布式哈希表(DHT)的主要思想,阐述了资源关键字查找方式,重点分析结点指针表的特性及其表中冗余信息对查找资源的影响,进而提出了覆盖冗余信息的方法(URFChord)改进结点指针表。URFChord方法首先要计算指针表的冗余量R(N),然后在不增大指针表存储空间的情况下,删除指针表冗余信息再添加R(N)个新的路由信息。通过性能分析及仿真实验,证实了这种改进方法的可行性和有效性,减少了平均查找路径长度,提高了查询效率。
张姗姗成卫青豆仁福
关键词:P2PCHORD冗余度
基于标准标签的用户兴趣模型研究被引量:6
2013年
信息大爆炸的网络时代,个性化推荐是解决信息"超负载"的有效办法。用户兴趣模型是个性化推荐的核心,关系着整个推荐系统的推荐质量。标签一直被用于资源分类,在个性化推荐方面却很少使用。文中采取向量空间模型的建模方法,利用个性化标签描述用户兴趣,并提出一套简洁有效的标签标准化方法—基于属性共现率的标签标准化以及基于聚类的标签标准化方法对用户的自定义标签进行标准化。该模型能有效降低用户兴趣模型的向量维数,避免分析标签语义的复杂过程,且能够从用户的角度贴切地表达用户兴趣。实验结果表明该模型有助于提高个性化推荐的服务质量。
杨晶成卫青郭常忠
关键词:个性化推荐用户兴趣模型向量空间模型
一种改进的基于MMTD的网络应用类型识别方法被引量:2
2012年
网络管理在很多方面需要识别网络流的应用类型。文中旨在改进和完善一种融合了中介数学理论的基于流统计特征的识别方法———基于MMTD(中介真值程度度量)的应用识别方法。原方法在效率上表现出了优越性和发展潜力,但方法中用到的参数基本都是基于网络专业知识和对流属性值的人工统计分析凭经验确定的。参数的确定没有系统的方法,影响识别方法的使用与推广。文中对原方法进行了如下改进与完善:(1)提出了一种能够反映对象测度(属性)分布特性的测度值与谓词对应关系,并给出了相应的真值程度计算方法;(2)提出了一种基于测度值分布密集程度的测度选取和权重计算方法;(3)提出了一种通过严格的统计及数据处理方法得到各种网络应用流属性的特征参数的方法。实验测试结果表明文中提出的改进和完善方案是有效的。
杨哲睿成卫青
关键词:中介真值程度
基于页面分类的Web信息抽取方法研究被引量:5
2013年
通过对现有Web信息抽取方法和当前Web网页特点的分析,发现现有抽取技术存在抽取页面类型固定和抽取结果不准确的问题,为了弥补以上两个不足,文中提出了一种基于页面分类的Web信息抽取方法,此方法能够完成对互联网上主流信息的提取。通过对页面进行分类和对页面主体的提取,分别克服传统方法抽取页面类型固定和抽取结果不够准确的问题。文中设计了一个完整的Web信息抽取模型,并给出了各功能模块的实现方法。该模型包含页面主体提取、页面分类和信息抽取等模块,并利用正则表达式自动生成抽取规则,提高了抽取方法的通用性和准确性。最后用实验证实了文中方法的有效性与正确性。
成卫青于静杨晶杨龙
关键词:WEB信息抽取正则表达式HTMLPARSER
共1页<1>
聚类工具0