公共文化服务平台

基于深度典型相关性分析的跨媒体语义检索被引量：2: 2018年; 基于典型相关性分析的跨媒体检索是一种将不同媒体特征通过相关性分析映射到同构的最大相关子空间,并在子空间中完成跨媒体数据间的相似性比较和检索的方法.典型相关性分析(canonical correlation analysis,CCA)是一种线性模型,并不能很好地挖掘跨媒体数据中的复杂相关关系.为此针对深度典型相关性分析(deep CCA,DCCA)的结构进行改进,使用隐含狄利克雷分布(latent Dirichlet allocation,LDA)发现文本语义信息并学习语义映射,提出了跨媒体深度相关性学习模型(cross-media correlation learning with deep canonical correlation analysis,CMC-DCCA)以及跨媒体语义相关性检索方法(cross-media semantic correlation retrieval,CMSCR).在维基百科文本图像数据集上的实验证明,CMC-DCCA模型能够较好地挖掘跨媒体数据中的复杂相关关系,CMSCR在跨媒体检索中具有较好的性能.; 王述史忠植; 关键词：语义映射跨媒体检索

深度学习研究与进展被引量：133: 2016年; 深度学习是机器学习领域一个新兴的研究方向,它通过模仿人脑结构,实现对复杂输入数据的高效处理,智能地学习不同的知识,而且能够有效地解决多类复杂的智能问题。近年来,随着深度学习高效学习算法的出现,机器学习界掀起了研究深度学习理论及应用的热潮。实践表明,深度学习是一种高效的特征提取方法,它能够提取数据中更加抽象的特征,实现对数据更本质的刻画,同时深层模型具有更强的建模和推广能力。鉴于深度学习的优点及其广泛应用,对深度学习进行了较为系统的介绍,详细阐述了其产生背景、理论依据、典型的深度学习模型、具有代表性的快速学习算法、最新进展及实践应用,最后探讨了深度学习未来值得研究的方向。; 孙志远鲁成祥史忠植马刚; 关键词：图像识别语音识别自然语言处理

并行化的情感分类算法的研究被引量：4: 2013年; 在海量数据集上执行情感分类任务时,传统的单机情感分类算法的扩展性成为系统的瓶颈。在云计算平台Hadoop上,实现了情感分类任务中特征提取、特征向量加权和情感分类等算法的MapReduce化。在情感语料数据集上,对各种子步骤组合下情感分类算法的精度及每种算法的时间开销进行了对比分析。实验结果验证了实现的并行化情感分类算法的有效性,同时它为用户选择合适算法实现情感分类任务提供了有价值的参考信息。; 余永红向小军商琳; 关键词：情感分类 HADOOP 云计算 MAPREDUCE

Support vector machine with mixture of kernels for automatic image annotation: 2013年; Automatic image annotation(AIA)has become an important and challenging problem in computer vision due to the existence of semantic gap.In this paper,a novel support vector machine with mixture of kernels(SVM-MK)for automatic image annotation is proposed.On one hand,the combined global and local block-based image features are extracted in order to reflect the intrinsic content of images as complete as possible.On the other hand,SVM-MK is constructed to shoot for better annotating performance.Experimental results on Corel dataset show that the proposed image feature representation method as well as automatic image annotation classifier,SVM-MK,can achieve higher annotating accuracy than SVM with any single kernel and mi-SVM for semantic image annotation.; 田东平Zhao XiaofeiShi Zhongzhi

最大化约束密度单类分类器被引量：1: 2014年; 针对单类分类器设计中的密度方法,采用以任务为导向的设计思想,通过人为指定核密度估计的密度函数上界,增强了边界低密度区域数据敏感性,同时也有效降低了密度估计的计算复杂度。进一步最大化全体样本的核密度估计函数并采用线性规划,可快速得到相应的稀疏解,因而称之为最大化约束密度单类分类器(Maximum constrained density based one-class classifier,MCDOCC)。为充分利用单类数据中可能出现的极少量异常数据,进一步提出了带负类的最大化约束密度分类器(MCDOCC with negative data,NMCDOCC),通过挖掘异常数据的先验信息来修正仅有正常类的数据描述边界,可提高分类器泛化能力。UCI数据集上的实验结果表明,MCDOCC的泛化能力与单类支持向量机相当,NMCDOCC较之则有所提高,从而能够更高效地估计目标类数据概率密度。; 赵加敏冯爱民陈松灿潘志松; 关键词：单类分类器概率密度估计先验信息

面向服务的云数据挖掘引擎的研究被引量：21: 2012年; 数据挖掘算法处理海量数据时,扩展性受到制约。在商业和科学研究的各个领域,知识发现的过程和需求差异较大,需要有效的机制来设计和运行各种类型的分布式数据挖掘应用。提出了一种面向服务的云数据挖掘引擎的框架CloudDM。不同于基于网格的分布式数据挖掘框架,CloudDM利用开源云计算平台Hadoop处理海量数据的能力,以面向服务的形式支持分布式数据挖掘应用的设计和运行,并描述面向服务的云数据挖掘引擎系统的关键部件和实现技术。依据面向服务的软件体系结构和基于云平台的数据挖掘引擎,可以有效解决海量数据挖掘中的海量数据存储、数据处理和数据挖掘算法互操作性等问题。; 余永红向晓军高阳商琳杨育彬; 关键词：云计算 HADOOP 数据挖掘

Parallel Web Mining System Based on Cloud Platform被引量：1: 2012年; Traditional machine-learning algorithms are struggling to handle the exceedingly large amount of data being generated by the internet. In real-world applications, there is an urgent need for machine-learning algorithms to be able to handle large-scale, high-dimensional text data. Cloud computing involves the delivery of computing and storage as a service to a heterogeneous community of recipients, Recently, it has aroused much interest in industry and academia. Most previous works on cloud platforms only focus on the parallel algorithms for structured data. In this paper, we focus on the parallel implementation of web-mining algorithms and develop a parallel web-mining system that includes parallel web crawler; parallel text extract, transform and load （ETL） and modeling; and parallel text mining and application subsystems. The complete system enables variable real-world web-mining applications for mass data.; Shengmei LuoQing HeLixia LiuXiang AoNing LiFuzhen Zhuang

面向异构语义映射的D3L转换算法及其性质研究被引量：1: 2018年; 桥规则为分布式动态描述逻辑(distributed dynamic description logics,D3L)提供了描述语义映射和知识传播的重要机制.现有的研究仅针对包含原子元素的同构桥规则.将研究扩展到了被包含端存在复合元素的异构桥规则的D3L推理问题.定义了分布式知识库的正则性.通过对桥规则进行形式变换并针对不同情形转换为已有的语言机制,提出了将动态描述逻辑DSROIQ作为局部本体语言的D3L知识库转换为单一DSROIQ知识库的算法,接着研究了该转换的性质,证明了该算法可以在多项式时间内终止、算法的目标知识库与原始知识库在可满足性上是等价的,进而证明了在上述桥规则存在的情况下正则D3L知识库的集中式推理具有与单一DSROIQ知识库推理相同的最坏时间复杂度.该算法使得D3L推理可以获得与现有的分布式推理方法相同的最坏时间复杂度并且解决了后者难以处理异构复合桥规则的问题.; 赵晓非史忠植史忠植; 关键词：正则性计算复杂度

联机局部自适应模糊C均值聚类算法被引量：3: 2013年; 基于模糊C均值(FCM)和局部自适应聚类(LAC)提出一种针对高维数据的联机局部自适应模糊C均值聚类算法(OLAFCM).OLAFCM通过为各类属性分别赋以相应的局部权重,使各类属性分布在不同属性组合的张量子空间内,从而有效降低采用全局降维方法造成的信息损失,同时适合聚类数据流.最后,在人工模拟和真实数据集上验证OLAFCM比之现有基于全局降维的划分联机聚类算法具有更好的性能.; 吴小燕陈松灿

Fusing PLSA model and Markov random fields for automatic image annotation被引量：1: 2014年; A novel image auto-annotation method is presented based on probabilistic latent semantic analysis(PLSA) model and multiple Markov random fields(MRF).A PLSA model with asymmetric modalities is first constructed to estimate the joint probability between images and semantic concepts,then a subgraph is extracted served as the corresponding structure of Markov random fields and inference over it is performed by the iterative conditional modes so as to capture the final annotation for the image.The novelty of our method mainly lies in two aspects:exploiting PLSA to estimate the joint probability between images and semantic concepts as well as multiple MRF to further explore the semantic context among keywords for accurate image annotation.To demonstrate the effectiveness of this approach,an experiment on the Corel5 k dataset is conducted and its results are compared favorably with the current state-of-the-art approaches.; 田东平Zhao XiaofeiShi Zhongzhi

渝B2-20050021-1　渝公网安备 50019002500403号　违法和不良信息举报中心　互联网出版许可证　新出网证(渝)字10号

国家自然科学基金(61035003)

文献类型

领域

主题

机构

作者

传媒

年份

用户反馈

国家自然科学基金(61035003)

文献类型

领域

主题

机构

作者

传媒

年份

用户登录

用户反馈