郑淼
- 作品数:10 被引量:10H指数:1
- 供职机构:浙江大学更多>>
- 发文基金:教育部“新世纪优秀人才支持计划”国家科技支撑计划更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于流形学习的稀疏编码算法研究及应用
- 随着近些年互联网技术和信息采集技术的快速发展,人们所获取的图像数据数量及图像维数都越来越高,如何有效地表达图像特征,方便图像的语义理解,已成为图像处理、模式识别及图像标注等领域亟需要解决的问题之一。 近年来,稀疏编码算...
- 郑淼
- 关键词:图像处理
- 基于流形稀疏编码的图像聚类的方法
- 基于流形稀疏编码的图像聚类的方法,包括获取待聚类的所有图像,将所有图像组成数据矩阵,获取每张图像中的SIFT特征;构造一个数据字典B,利用数据矩阵X,学习数据字典B和图像的流形稀疏编码S;使用K-means聚类方法,采用...
- 王灿卜佳俊陈纯郑淼吴昊
- 基于流形稀疏编码的图像聚类的方法
- 基于流形稀疏编码的图像聚类的方法,包括获取待聚类的所有图像,将所有图像组成数据矩阵<Image file="DEST_PATH_IMAGE002.GIF" he="6" imgContent="undefined" im...
- 王灿卜佳俊陈纯郑淼吴昊
- 文献传递
- 用于在线论坛的信息实时推荐方法
- 用于在线论坛的信息实时推荐方法,包括获取指定时间段内用户参与讨论过的所有主题链数据,分析主题链中的包含的潜在主题;对不同的潜在主题分别衡量用户参与讨论的相互影响值和用户自发兴趣值;计算用户参与新主题链的趋势概率,并依此对...
- 陈纯卜佳俊吴昊郑淼张利军
- 文献传递
- 基于语义本体的噪声数据清洗方法
- 基于语义本体的噪声数据清洗方法,包括建立一个存储不含噪声的干净数据的干净数据库;获取待清洗的文本数据,对待清洗数据进行预处理以获取结构化数据,所述的结构化数据组成文本数据的词的集合;引入知识网络的语义概念,获取每两个词的...
- 陈纯卜佳俊汪达舟郑淼张利军
- 基于语义本体的噪声数据清洗方法
- 基于语义本体的噪声数据清洗方法,包括建立一个存储不含噪声的干净数据的干净数据库;获取待清洗的文本数据,对待清洗数据进行预处理以获取结构化数据,所述的结构化数据组成文本数据的词的集合;引入知识网络的语义概念,获取每两个词的...
- 陈纯卜佳俊汪达舟郑淼张利军
- 文献传递
- 一种垃圾博客检测方法
- 本发明公开了一种垃圾博客检测方法。本发明是通过分析网络垃圾的作弊技术,针对垃圾博客的本质属性,运用二元分类的文本分类的技术,围绕博客文本内容特征、博客页面链接特征和博客文本时间分布特征等三个角度进行方法设计。本发明是建立...
- 陈纯卜佳俊张峰仇光郑淼
- 文献传递
- 基于正则化主题建模的隐式产品属性抽取被引量:10
- 2011年
- 为实现产品意见挖掘中的隐式产品属性抽取,在传统主题建模思想的基础上,通过分析评论信息中不同产品属性对应的意见词分布以及意见词的主题依赖性假设,提出一种基于正则化思想的新主题建模框架.在该框架下,评论信息中的意见词特征,通过定义在不同评论中意见词的使用相似度上的正则化因子,纳入到传统的主题建模框架中.正则化的基本思想为:若2条评论在意见词的使用模式上相似,则它们评论相同的产品属性的概率越高.定性和定量2种实验结果均表明,本文的正则化主题模型较传统的主题模型算法有更高的准确率,说明本文的正则化思想是有效的.
- 仇光郑淼张晖朱建科卜佳俊陈纯杭航
- 关键词:主题建模正则化
- 基于传播的产品属性抽取
- 2010年
- 针对意见挖掘中产品意见对象的获取问题,提出一种基于传播(propagation)思想的产品属性抽取方法.该方法利用产品属性与意见词(opinionword)之间,以及产品属性本身和意见词本身的关系,通过定义的规则,抽取产品属性.对属性与意见词之间的关系采用依存语法进行描述.产品属性和意见词的抽取过程不断迭代,直至无新的属性可抽取.同时,为消除传播过程中引入的噪音,提出3种相应的噪音消除策略.实验结果表明,该方法比传统的产品属性抽取方法有更高的准确率和召回率.
- 仇光郑淼卜佳俊史源陈纯
- 关键词:属性抽取依存语法
- 一种混合双向聚类好友推荐方法
- 本发明公开了一种基于用户行为和个人属性的混合双向聚类好友推荐方法。本方法基于用户的交友选择行为与用户属性,计算用户择友偏好。依据用户择友偏好对全体用户进行聚类,并计算得出每个用户对其它用户的喜爱程度。之后,基于每对用户间...
- 卜佳俊陈纯王北斗陈孝峰郑淼王灿
- 文献传递