国家高技术研究发展计划(2011AA7032030D)
- 作品数:18 被引量:76H指数:5
- 相关作者:王波席耀一李弼程周杰陈刚更多>>
- 相关机构:解放军信息工程大学中国人民解放军信息工程大学中国人民解放军南京政治学院更多>>
- 发文基金:国家高技术研究发展计划国家社会科学基金国家部委资助项目更多>>
- 相关领域:自动化与计算机技术电子电信文化科学更多>>
- 基于多策略的短文本信息流会话抽取被引量:2
- 2016年
- 互联网中存在大量的短文本信息流,需要对其进行会话抽取,将相同主题的内容合并到同一会话中。会话中的内容、时间和用户关系都会对会话抽取的性能产生影响,针对该问题提出了一种基于多策略的会话抽取算法。首先,基于内容、时间和用户关系进行会话分割得到会话片段;然后,利用词向量计算内容语义相似度,并结合时间信息计算会话片段间的相关度,对其进行聚类,实现会话抽取。在三个来源于真实聊天记录的数据集上进行实验的结果表明,本方法优于传统方法,综合F值分别提高了38.5%、15.7%和26.8%。
- 李天彩王波席耀一
- 关键词:聊天记录
- 基于非负矩阵分解的网络重叠社区发现研究被引量:5
- 2014年
- 重叠社区发现已成为复杂网络研究的热点内容。传统基于非负矩阵分解的社区发现方法忽视了特征矩阵选择的重要性,通过模块度优化来确定社区数目导致计算开销大和存在模块度分辨率受限制等问题。针对上述问题,提出了一种基于贝叶斯先验的非负矩阵分解社区发现方法。通过引入贝叶斯非负矩阵分解模型,实现了对社区数目的有效迭代求解。为了得到节点与社区的隶属关系,采用线性转换函数思想定义了社区隶属度指数,并通过设定合理的划分阈值得到网络重叠社区结构。在不同规模的计算机生成和真实世界网络上进行了测试,并与典型算法进行比较,实验结果表明了该算法的可行性和有效性。
- 李玉翔李弼程郭志刚
- 关键词:复杂网络特征矩阵
- 基于网络资源的实体知识库系统设计研究——以政府相关实体知识库为实例被引量:2
- 2016年
- 随着大数据时代的来临,信息知识化已成为信息管理的一个发展趋势。而知识库作为一种常见的知识存储和管理工具,其当前的构建和维护仍以手工方式为主,致使知识库中知识的覆盖范围十分有限且耗费巨大成本。针对上述问题,本文设计了一种实体知识库系统架构。该架构将命名实体相关技术进行有效整合,并利用网络在线资源自动构建中文实体知识库。在数据结构方面,提出了基于三层数据模型的数据存储管理结构,并根据网络资源各自的特点分别抽取出不同类别的知识,实现显式知识和隐式知识的获取和存储,进而为信息的知识化管理以及深层次分析提供支持。
- 周杰李弼程林琛韩永峰
- 关键词:系统设计网络资源
- 基于邻居向量的近似子图匹配被引量:1
- 2014年
- 将近似子图匹配分成节点匹配和边匹配两个阶段。将数据图中所有节点的h-邻居节点表示成向量形式,采用一种启发式推理算法进行节点匹配得到节点对应关系,使用查询节点权重提高匹配相似度,使用节点过滤、索引技术和孤立候选节点提高运算效率;利用邻居向量索引得到匹配节点集合的扩展图,进行边匹配,得到匹配图。在真实数据上进行实验,实验结果表明,该算法效果较好,运算效率较高,可以应用于节点标签稀疏的情况和top-k近似匹配。
- 陈东王波席耀一唐浩浩
- 基于主题模型的中文Distant Supervision噪声标注识别方法
- 2016年
- 针对Distant Supervision关系抽取方法训练语料存在大量噪声的问题,提出一种基于主题模型的噪声标注识别方法。该方法首先分析了中文Distant Supervision实体关系抽取方法面临的关系句子实例结构复杂的问题,然后利用自定义的模式以及模式聚类实现模式表示与聚合,最后使用主题模型识别噪声标注。实验结果表明,文章方法能有效识别噪声标注,用滤除噪声标注后的数据训练实体关系抽取模型,实验证明经过噪声滤除后实体关系抽取性能得到显著改善。
- 刘绍毓李弼程周杰席耀一唐浩浩
- 关键词:DISTANTSUPERVISION关系抽取主题模型
- 基于用户关系挖掘的多策略推荐算法被引量:2
- 2013年
- 个性化推荐服务为解决网络信息过载问题提供了有效手段。传统的推荐方法大多只关注于如何提高推荐的准确性,而忽略了推荐多样性对用户体验的影响。文章将社会网络用户关系挖掘应用于用户偏好预测及推荐中,提出了一种基于用户关系挖掘的多策略推荐算法。采用信任传播模型挖掘用户间的信任度,计算用户偏好配置文件的余弦相似性获得用户间的相似度,并给出4种将用户信任度、相似度结合的策略,在定义用户偏好预测函数的基础上采用Topn原则为用户给出推荐结果。实验结果表明,文章方法不仅减少了数据稀疏性的影响,而且兼顾了推荐准确性与多样性指标,提高了推荐系统的整体性能。
- 李玉翔周杰许斌李弼程
- 关键词:信任传播
- 基于社团信息传播能力分析的微博舆情热点监测
- 2015年
- 在分析微博舆情热点监测研究局限的基础上,从信息传播角度提出一种基于社团信息传播能力分析的微博舆情热点监测方法。该方法首先基于微博用户间信息交互构建微博信息交互网络;然后采用快速Newman社团发现算法挖掘信息交互网络中的信息传播社团;最后根据用户传播影响力和用户间交互紧密度对社团的传播能力进行评估,并通过对具有较强信息传播能力社团中信息交互的监测实现微博潜在舆情热点的挖掘。实验结果表明,微博信息传播社团的信息传播能力与热点微博信息在社团中的真实传播效果具有较高的拟合度,通过对强传播能力社团中信息交互情况的实时监测,可发现潜在舆情热点信息。
- 陈刚林琛席耀一李弼程
- 关键词:舆情信息传播
- 实体关系抽取研究综述被引量:18
- 2016年
- 实体关系抽取作为信息抽取的核心任务和重要环节,能够实现实体对间语义关系的识别,对句子语义理解及实体语义知识库构建有着重要作用。回顾了实体关系抽取的发展史,总结了有监督实体关系抽取、无监督实体关系抽取、半监督实体关系抽取和开放式实体关系抽取4类方法的原理和代表性研究,并对各类方法进行了详细比较。
- 刘绍毓李弼程郭志刚王波陈刚
- 关键词:实体关系抽取
- 基于MIN-MAX云重心推理的目标威胁评估方法被引量:15
- 2014年
- 将云推理技术引入信息融合领域,提出一种新的基于MIN-MAX云重心推理的威胁评估方法。按照实际应用背景下目标的特点,构建分层式威胁评估属性集合;定义云群、云族、云三层隶属关系,对各属性进行云模型转换,并根据各属性的云模型设计前件云发生器;依据专家经验,构建推理规则库,并设计MIN-MAX云重心推理算法,将归一化属性值输入相应的前件云发生器,生成属性云滴,通过由下而上地逐级推理,得到威胁度云滴;最后,将经过多次重复推理得到的威胁度云滴输入逆向云发生器,输出值作为最终的威胁程度。以联合防空作战为背景,仿真实现了空中目标的威胁评估,验证了该方法的有效性。
- 张银燕李弼程
- 关键词:云模型信息融合
- 基于多特征融合的微博情感摘要方法
- 2016年
- 是对微博文本的主题和情感信息进行抽取,归纳为带有情感倾向的总结性描述。已有的相关研究忽视或者不能准确得到话题的正面和负面情感摘要。针对该问题,提出一种基于多特征融合的微博情感摘要方法。首先,对语料进行预处理并统计语料中的共现词对;然后,利用BTM模型挖掘文档中的隐含主题,计算语料和文档的主题概率分布;最后,利用该分布计算句子的主题相关度和情感特征权重,并抽取与话题相关度高且情感特征权重较大的句子形成正面和负面情感摘要。实验结果表明,相比传统方法,文章方法能够有效提高微博情感摘要的综合性能。
- 张佳明王波席耀一刘欣田营
- 关键词:主题相关度情感特征