王大玲
- 作品数:106 被引量:906H指数:18
- 供职机构:教育部更多>>
- 发文基金:国家自然科学基金高等学校优秀青年教师教学科研奖励计划辽宁省自然科学基金更多>>
- 相关领域:自动化与计算机技术文化科学经济管理理学更多>>
- 搜索引擎中一种基于PLSA的用户模型
- 1前言当前搜索引擎使用的基于关键词的搜索,忽略了用户的差异和用户动机。新一代的搜索引擎应该具有互动式搜索等特点,更需要对用户提供个性化
- 于芳王大玲于戈白旭辉
- 关键词:REQUIREMENTFEEDBACK
- 文献传递
- 变压器故障诊断专家系统的设计被引量:10
- 2007年
- 故障诊断型专家系统最重要的问题是知识表示和推理机制.根据人类专家对变压器故障诊断的特点,在学习人类专家诊断变压器故障过程的基础上,对构建变压器故障诊断专家系统的系统结构、知识表示和推理机制进行了较详细的分析和讨论.
- 史江萍佟伟光王大玲
- 关键词:知识表示专家系统
- 一种面向微博客文本流的噪音判别与内容相似性双重检测的过滤方法被引量:15
- 2012年
- 微博客作为一种新的用户信息传播载体,在网络舆情发起和传播中起着重要作用。由于用户有意(上传广告)、无意(转发)操作所带来的大量噪音微博和相似微博,对网络舆情分析和用户浏览造成极为不利的影响。检测这些噪音微博和相似微博,对微博数据进行提纯,成为一个亟待解决的问题。基于统计数据分析了噪音微博和相似微博的特点,提出一种面向微博文本流的噪音判别和内容相似性双重检测的过滤方法:通过URL链接、字符率、高频词等特征判别,过滤噪音微博;通过分段过滤和索引过滤的双重内容过滤,检测和剔除相似微博。实验表明该方法能有效地对微博数据进行提纯,高效准确地过滤掉相似微博和噪音微博。
- 王琳冯时徐伟丽杨卓王大玲张一飞
- 支持Internet上个性化信息重组与发布的Web挖掘关键技术的研究被引量:2
- 2005年
- Internet上个性化信息的重组与发布是Web个性化技术的一个重要组成部分,这一领域目前存在的主要问题是:并非没有信息重组和发布的工具,而是缺乏能够使这类工具高效工作的支持技术。本文提出一种将流数据处理技术引入Web点击流、IP地址流及页面文本流挖掘和分析过程,研究基于Web数据流挖掘的用户行为和需求分析方法;将本体和领域知识引入Web内容挖掘过程,研究领域知识指导下的Web内容挖掘方法;将基于Web数据流挖掘的用户行为和需求分析与领域知识指导下的Web内容挖掘相结合,研究Internet上Web信息模式和Web用户模型及其相互关系的建立;将上述研究成果应用于实际,以期达到高效地支持Internet上满足用户个性化要求的信息重组与发布的目的。
- 王大玲胡明涵于戈鲍玉斌
- 关键词:WEB内容挖掘
- 星链ER模型:一种数据仓库概念设计模型被引量:14
- 2005年
- 对于流程工业中的数据仓库建设 ,存在一贯性质量分析的需求 ,即前一个工序的工艺可能影响下一个工序的产品质量 .针对这种需求 ,提出了一种数据仓库的概念设计模型 ,星链 ER模型 .其中引入了链式事实主题结构的概念 ,并把度量细分为传递型度量与非传递型度量 ,给出了星链 ER模型的图形表示法以及由概念模型到逻辑模型的转换规则 .该模型可以方便地转化成多种逻辑模型如星型模式、雪花模式以及星座模式 .
- 鲍玉斌孙焕良于戈嵇晓王大玲
- 关键词:数据仓库星型模式
- 一种Web个性化推荐服务中间件技术的研究与实现
- 1引言Web使用挖掘是从记录Web页面被用户使用情况的Log文件中发现用户访问模式的过程,Web个性化推荐则是根据Web挖掘结果及当前用户的访问模式,为用户推荐其感兴趣的页面。目前面
- 佟维孙华文王大玲于戈鲍玉斌
- 关键词:PERSONALIZATIONMIDDLEWARE
- 文献传递
- 一种基于LDA的潜在语义区划分及Web文档聚类算法
- 本文应用LDA模型进行文档的潜在语义分析,将语义分布划分成低频、中频、高频语义区,以低频语义区的语义进行Web游离文档检测,以中、高频语义区的语义作为文档特征进行文档聚类,采用文档类别与语义互作用机制对聚类结果进行修正。...
- 刘振鹿王大玲冯时张一飞方东昊
- 关键词:LDA潜在语义文档聚类
- 文献传递
- 支持高效更新与查询操作的XML动态编码
- XML(eXtended Markup Language)在文档展现和交换领域得到了广泛的认同,并已经成为Internet上数据交换的事实标准.目前对XML的研究主要集中在如何有效地对XML文档进行查询、检索方面,但是,...
- 白旭晖王大玲于戈冯时
- 关键词:XML文档查询操作数据交换XML更新
- 文献传递
- 基于PLSA方法的用户兴趣聚类被引量:5
- 2008年
- 为了在个性化搜索过程中能够准确地挖掘到用户的潜在兴趣并进行相应的聚类分析,提出采用潜语义空间的Zipf分布的特性,并结合PLSA(概率潜在语义分析)来获取全文的语义.即先通过Zipf分布原理找到文档的潜在语义空间,在此空间中对用户的兴趣进行聚类,并建立用户兴趣描述文件(user profile),即建立用户兴趣层次树.实验表明,所提出聚类算法的聚类效果明显优于传统的VSM(向量空间模型)的聚类效果,同时,在著名的CTI数据集上的个性化推荐实验结果也充分说明基于潜在语义空间构建的用户兴趣描述与用户真实兴趣相符合.
- 陈冬玲王大玲于戈于芳
- 关键词:PLSAZIPF分布
- 一种基于内容特性的文本聚类方法被引量:3
- 2007年
- 在基于概率模型的聚类中,簇模型对数据分布的拟合性直接影响着聚类质量。基于内容的文本数据分布的复杂性导致单一因素的簇模型无法准确拟合文本数据的分布特征。该文认为文本基于内容的分布特性主要受主题内容和通用写作方式影响,给出了一种基于主题模型和通用模型的混合簇模型和基于该簇模型的文本聚类方法。实验表明该聚类方法较单一因素的簇模型具有更好的拟合性,聚类质量更好。
- 李晓光宋宝燕于戈王大玲
- 关键词:聚类混合模型