华东师范大学软件学院海量计算研究所
- 作品数:16 被引量:62H指数:5
- 相关机构:复旦大学信息科学与工程学院复旦大学信息科学与工程学院计算机科学系复旦大学计算机科学技术学院更多>>
- 发文基金:国家自然科学基金国家高技术研究发展计划上海市自然科学基金更多>>
- 相关领域:自动化与计算机技术经济管理文化科学更多>>
- 基于活跃用户特征的论坛广告投放
- 网络论坛用户众多,广告投放市场大,而目前针对网络论坛的个性化广告却很少,这是因为论坛数据庞杂,信息更新快,实现广告的精准投放有困难.提出了一个基于活跃用户特征词分析的论坛广告个性化投放模型,在模型中提取论坛活跃用户,对活...
- 张召钱卫宁周傲英
- 关键词:广告投放用户特征
- 文献传递
- 轨迹大数据的比较算法研究被引量:2
- 2016年
- 为了对轨迹大数据比较算法进行深入了解和研究,介绍了各类轨迹比较算法,并结合轨迹大数据的研究发展和应用背景,对轨迹大数据比较算法进行较为全面和系统的综述。随着轨迹大数据应用问题的不断凸显,轨迹大数据的研究需要结合目标需求,深入研究轨迹数据比较算法的大数据计算、算法智能性以及算法的效率和有效性等问题。
- 曾万聃周敏奇刘云翔
- 关键词:大数据语义
- 一种基于不确定性因素叠加的Web服务质量度量方法被引量:14
- 2009年
- 以克服现有服务质量度量方法的主观性、反映服务调用中存在的不确定性和各影响因素之间存在的内在关系为出发点,定义了原子服务调用率、成功率和效率3个因素,通过对原子服务调用的历史信息进行统计计算得到各因素的量值,提出一种基于不确定性因素叠加的原子服务质量度量方法,以及基于各原子服务质量平均值的高粒度Web服务的质量度量标准,并给出服务优先级的判断方法.性能分析验证了所提出方法的高效性、可扩展性和可行性.
- 岳昆刘惟一王晓玲李劲
- 关键词:WEB服务服务质量
- 一种支持高效XML路径查询的自适应结构索引被引量:10
- 2009年
- 提出了一种新的自适应结构索引:AS-Index(adaptive structural index),能够克服现有静态索引和自适应索引的缺陷,具备高效的查询和调整性能.AS-Index建立在F&B-Index的基础之上,其索引结构包括F&B-Index,Query-Table和Part-Table.Query-Table能够记录频繁查询,避免了查询过程中的冗余操作.并且,在Query-Table的基础上提出了自底向上的查询处理过程,能够充分利用现有的频繁查询高效地回答非频繁查询.Part-Table用于优化包含祖先后裔边的查询,进一步提高了查询性能.现有的自适应结构索引的调整粒度是XML元素节点,调整过程往往需要遍历整个文档.而AS-Index是基于F&B-Index节点的增量调整,其过程是局部的,高效的,并且能够支持复杂分支查询的调整.实验结果表明,AS-Index在查询和调整性能上优于现有的XML结构索引.同时,相比于现有的自适应结构索引,AS-Index针对大规模文档具有更加优良的可扩展性.
- 张博耿志华周傲英
- 关键词:XML结构索引查询处理
- Hash-Search:基于哈希表的快速XML关键字检索算法
- 随着XML的广泛应用,XML上的关键字检索逐渐成为一个研究热点.现有的关键字检索方法主要基于LCA计算和候选点选择两种操作,存在以下问题:首先,现有方法利用Dewey编码来表示结点,LCA的计算过程需要逐段地比较Dewe...
- 王伟彦张博王晓玲周傲英
- 关键词:哈希表关键字检索XML索引结构
- 文献传递
- 数据流处理技术在电信网管系统中的应用被引量:6
- 2008年
- 网络流量监测技术是电信运营商所关注的重点之一。随着网络传输带宽的不断增加,传统的基于磁盘的处理技术已经不能够满足运营管理的需要,数据流处理技术的出现为网络流量监测应用提供了一种新的解决方案。SMART[1,2]和RealMon[3]是将数据流处理技术应用于网络流量监测的两个应用系统。文中结合上海电信在骨干网流量监测上的应用需求,对这两个系统的设计与应用进行了介绍。SMART系统以数据流上的频繁项挖掘算法为基础,支持NetFlow数据流上长时间滑动窗口内的Top-K查询,实现了对网络流量分布的实时监测。RealMon系统采用数据流上的降维分析算法对SNMP数据流进行分析,通过监测网络链路上不同流量数据的相关性变化来发现异常流量。实验和在真实环境中的应用表明,SMART和RealMon系统能够满足骨干网流量监测应用的需要,并且极大地提高了监测系统的性能。
- 宫学庆闫莺常建龙张晨周傲英
- 关键词:数据流网络流量监测TOP-K查询异常检测
- 基于KL距离的非平衡数据半监督学习算法被引量:13
- 2010年
- 在实际应用中,由于各种原因时常无法直接获得已标识反例,导致传统分类方法暂时失灵,因此,基于正例和未标识集的半监督学习顿时成了理论界研究的热点.研究者们提出了不同的解决方法,然而,这些方法都不能有效处理非平衡的分类问题,尤其当隐匿反例非常少或训练集中的实例分布不均匀时.因此,提出了一种基于KL距离的半监督分类算法——LiKL:依次挖掘出未标识集中的最可靠正例和反例,接着使用训练好的增强型分类器来分类.与其他方法相比,不仅提高了分类的查准率和查全率,而且具有鲁棒性.
- 许震沙朝锋王晓玲周傲英
- 关键词:半监督学习KL距离朴素贝叶斯LOGISTIC回归
- QSWS:一种基于QoS的Web服务组织
- Web服务技术受到学术界和产业界越来越多的关注,其应用也越来越广泛.功能相同或类似的Web服务数量日益增加.在使用某个Web服务之前,服务消费者通常需要有关web服务的服务质量(QoS)方面的信息,然而,目前的UDDI注...
- 李艳丽王晓玲魏芳许震周傲英
- 关键词:服务质量SKYLINESAW服务发现模型用户请求
- 文献传递
- 室内环境下的限制性路径查询处理
- 随着移动计算的发展和移动设备的普及,移动数据管理已经应用在军事、交通等很多领域中.室内移动数据管理作为其中一部分,其应用领域也越来越广泛,比如在地铁或者飞机场内为用户提供类似室外空间下的GPS路径搜索功能的服务.然而由于...
- 张一桢金澈清周傲英
- 关键词:图模型
- 文献传递
- 大规模分布式系统中的多属性查询处理被引量:14
- 2008年
- 大规模分布式系统中的复杂查询处理是将对等计算技术运用于关键应用中的重要问题,是学术界与工业界所共同关注的研究问题.文中介绍了一种高效、可伸缩的通用的基于类Chord协议的多属性查询处理技术GChord.它既支持匹配查询也支持范围查询.和现有其它技术相比,对于任何数据元组,GChord只需要对其编码和索引一次,且能将查询处理的代价限制在一个很小的范围内.因此,它能在索引维护代价和查询效率之间达到平衡.GChord还提供优化技术以进一步提升性能.实验证实了GChord具有较高的查询处理效率以及较低的索引维护代价.
- 周傲英周敏奇钱卫宁张蓉
- 关键词:重叠网络分布式系统