您的位置: 专家智库 > >

国家自然科学基金(61202181)

作品数:3 被引量:11H指数:2
相关作者:乔亚男范亚平李孟超万迪昉武艳芳更多>>
相关机构:西安交通大学西南科技大学南京大学更多>>
发文基金:国家自然科学基金中央高校基本科研业务费专项资金中国博士后科学基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 3篇中文期刊文章

领域

  • 3篇自动化与计算...

主题

  • 2篇相似度
  • 1篇信息检索
  • 1篇信息需求
  • 1篇映射
  • 1篇语义相似
  • 1篇语义相似度
  • 1篇噪音数据
  • 1篇随机场
  • 1篇随机场模型
  • 1篇条件随机场
  • 1篇条件随机场模...
  • 1篇相似度计算
  • 1篇谐音
  • 1篇新词
  • 1篇描述逻辑
  • 1篇加权
  • 1篇本体
  • 1篇本体映射
  • 1篇QTP
  • 1篇查询

机构

  • 3篇西安交通大学
  • 1篇南京大学
  • 1篇西南科技大学

作者

  • 2篇乔亚男
  • 1篇齐勇
  • 1篇薛咏
  • 1篇刘跃虎
  • 1篇万迪昉
  • 1篇李孟超
  • 1篇冯博琴
  • 1篇范亚平
  • 1篇武艳芳

传媒

  • 1篇模式识别与人...
  • 1篇南京大学学报...
  • 1篇西安交通大学...

年份

  • 1篇2016
  • 1篇2015
  • 1篇2013
3 条 记 录,以下是 1-3
排序方式:
基于条件随机场模型和文本纠错的微博新词词性识别研究被引量:7
2016年
针对微博数据特点,采用降噪算法和条件随机场模型对微博数据进行词性标注,并对其中比重较大的谐音词使用贝叶斯方法进行词性二次纠正.首先利用新浪平台API和爬虫获取原始微博数据,再根据噪音特点人工制定规则进行降噪.由于条件随机场在中文词性标注中特征提取的优势,使用条件随机场模型对降噪后的微博语料词性标注.在此基础上,利用微博语料中谐音词比重较大的特点,将微博词语转化为拼音,根据贝叶斯方法计算得到谐音词的原生词候选,再根据词语的上下文建立谐音词和原生词映射,并利用原生词的词性已知的性质,对谐音词进行词性纠错.实验结果表明,该方法可以较好地标注微博未登录词,词性标注准确率达到95.23%.
韩彦昭乔亚男范亚平李孟超万迪昉
关键词:条件随机场噪音数据
ABox推理计算实体相似度被引量:2
2015年
针对主题图本体映射中主题上下文语义不易确定,缺少分类信息,但有明确的结构语义特征的特点,提出了A-Sim主题图本体映射算法。首先对主题图中的主题进行分类,利用描述逻辑语言ALCIR+的表达能力,根据主题属性及关联关系建立各种能表达上下文语义信息的概念术语集,将主题图本体转换为断言集合;其次在断言集合上进行多项式复杂度实例检测,记录模型构造过程中的个体,获得主题的上下文语义;最后将上下文语义结合元素级概念相似度算法计算实体综合相似度,获得异构主题图实体间的实体映射关系。通过对主题图进行相似度计算实验,结果证明新算法对主题图实体相似度计算综合性能至少提升了14%。
薛咏冯博琴武艳芳
关键词:本体映射相似度计算描述逻辑
查询词相似度加权的邻近性检索方法被引量:2
2013年
传统的邻近性检索模型同等地看待所有查询词,不加区分地考虑所有查询词的邻近性,造成"平行概念效应",影响邻近性检索方法的性能.文中提出一种查询词相似度加权的邻近性检索方法.该方法根据查询词之间的语义相似度对查询词邻近性统计量加权,可进一步推断用户的实际信息需求,挖掘查询中蕴含的更深层次的信息.实验结果表明,在短查询较多的应用环境下,文中方法可较显著提升传统邻近性检索模型的性能,有效规避查询词邻近性的平行概念效应.
乔亚男刘跃虎齐勇
关键词:信息检索语义相似度信息需求
共1页<1>
聚类工具0