国家重点基础研究发展计划(2010CB328106) 作品数:9 被引量:74 H指数:6 相关作者: 王晓玲 周傲英 俞阳 张晨曦 贾金原 更多>> 相关机构: 华东师范大学 同济大学 上海电力学院 更多>> 发文基金: 国家重点基础研究发展计划 国家自然科学基金 国家教育部博士点基金 更多>> 相关领域: 自动化与计算机技术 更多>>
一种基于概率图模型的不确定性数据世系表示方法 被引量:11 2011年 不确定性数据的世系分析是基于数据产生和演变的过程来跟踪数据不确定性的来源.为了有效地描述数据间复杂的相关性及不确定性,并从理论上保证世系分析中概率计算的正确性,文中研究了基于贝叶斯网这一重要的概率图模型的不确定性数据世系表示方法.以世系的布尔公式和不确定性数据本身为出发点,提出了将布尔公式等价转换为贝叶斯网的方法,并讨论了相应的条件独立性质和概率语义.案例研究和实验结果表明,文中的方法为世系分析提供了一种有效性的、可扩展的数据相关性表示和概率计算框架. 岳昆 刘惟一 朱运磊 张伟关键词:不确定性数据 概率图模型 贝叶斯网 FDSS:基于HDFS的海量音乐特征数据存储系统 被引量:2 2011年 随着互联网上音乐数目的迅速增长,传统的单机和小规模分布式平台已经不能满足海量音乐特征数据管理的需要;Hadoop分布式文件系统(HDFS)具有可扩展性、高可用性、容错性的优势,为海量音乐特征数据提供了有效的管理平台.提出了海量音乐特征数据存储系统FDSS:基于HDFS平台和MapReduce框架,设计了音乐特征数据的存储结构,实现了海量音乐特征数据的存储和读取;结合格雷码为音乐特征数据建立索引,优化了数据分布和快速读取;引入分布式内存缓存Memcached存储频繁访问的数据,优化了数据读取时间.系统演示了对海量级音乐特征数据的分布式存储和对指定音乐特征数据的快速读取功能. 范远超 徐辰 于政 周敏奇 王晓玲关键词:HDFS MAPREDUCE 格雷码 MEMCACHED 面向用户观点分析的多分类器集成和优化技术 被引量:4 2013年 网络上用户生成的数据(User-Generated Data)富含用户的观点(情感),自动识别这些用户观点对很多的Web应用具有重要的作用,例如推荐系统和电子商务/政务智能系统等.但用户的观点表达通常与领域是相关的,因此对于不同的分析领域,用户难以选择到效果最好的分类器.文中针对用户观点分析问题设计了一个三阶段的多分类器集成框架,在此框架下用户只需指定可用的分类器,系统将自动选择一组最优的分类器组合,将它们的预测结果整合为最终分类结果,同时能够保证分类效果优越于最好的单分类器.针对分类器组的选择过程中面临的组合爆炸问题,文中在考虑分类器的准确度和多样性的基础上,设计了一个贪心算法选择成员分类器,并证明该算法是2-近似的.最后,在不同领域的真实数据集上进行了充分的实验,实验结果验证了文中提出的框架和算法的有效性. 林煜明 朱涛 王晓玲 周傲英关键词:多样性 广告点击率估算技术综述 被引量:18 2013年 计算广告是根据给定的用户和网页内容,通过计算得到与之最匹配的广告并进行精准定向投放的一种广告投放机制.广告的点击率预测是指利用点击日志预测的点击率,其结果受到广告的自身性质、广告位置、页面信息、用户性质,以及广告主信誉等诸多因素的影响.有效地预测广告的点击率,对于提高广告投放的效率有着至关重要的作用.本文介绍了广告点击率预测的常用模型,包括历史数据丰富的广告点击率预测模型、新广告和稀疏广告的点击率估算模型和点击率预测的优化模型,并通过真实数据集举例说明了其实现的方法. 纪文迪 王晓玲 周傲英关键词:逻辑回归模型 贝叶斯方法 面向P2P网络的渐进式三维场景更新策略 被引量:6 2010年 近年来网上大规模虚拟环境实时漫游已经成为WebGIS的新兴研究领域。为缓解用户终端极其有限的存储空间与海量场景之间的矛盾,设计了一种面向对等网的新型渐进式场景更新策略(PSRM)。在剔除场景前,节点通过分别计算场景文件对自身视点的"视觉保留度"、场景文件对自身兴趣区域(AOI)邻居的"潜在贡献度"及"物体重用度",综合确定需要被剔除的场景,并按照逐渐降低场景分辨率的策略剔除旧有场景数据。仿真显示,PSRM在下载饱满度、基网格下载饱满度两个衡量漫游效果的重要指标上较现有系统有明显提升,同时能大幅降低漫游过程中的服务器端负载。 王伟 贾金原 张晨曦 俞阳关键词:WEBGIS 大规模虚拟环境 对等网 面向DaaS保护隐私的模糊关键字查询 被引量:14 2016年 由于在数据库服务(Database as a Service,DaaS)模式下,数据库服务提供者是半可信的(Honest-But-Curious),因此,为了保证外包数据的机密性和安全可查询,数据拥有者通常采用特定的加密技术加密外包数据,如采用可搜索加密技术、同态加密技术等实现外包加密数据上的安全查询.然而,且当前提出的大多数方法都基于关键字精确匹配查询,即使存在少量针对加密数据上的模糊查询,也在查询效率、存储开销和安全性方面存在一定的局限性,不适用于DaaS数据库服务模式.文中首次提出了融合具有高编码效率的Huffman编码和具有数据存储优势的布鲁姆过滤器,并结合现有的安全加密方法,实现了DaaS模式下保护隐私的模糊关键字查询处理.一方面,基于Huffman编码的树型索引提供了较高的查找效率;另一方面,基于布鲁姆过滤器的模糊关键字集合实现了较小的存储开销.安全分析、性能分析以及真实论文集上的实验结果进一步验证了文中查询算法的安全性、存储开销和查询效率. 李晋国 田秀霞 周傲英关键词:模糊查询 数据安全 布鲁姆过滤器 IBE-XKMS:一个基于XML的IBE密钥管理服务体系 被引量:6 2010年 本文详细分析了基于身份的公钥加密体制(IBE)较PKI在XKMS方面的应用优势,提出了一个面向IBE的XKMS服务体系——IBE-XKMS,阐述了系统管理、身份认证、密钥生成、密钥管理等模块的功能架构以及系统服务的逻辑关系,设计了4类IBE密钥服务,除实现基本的XKMS密钥操作接口外,还设计了支持零客户端安全应用开发的数字信封和数字签名等服务接口,为下一代网络开发环境提供了一个完整的IBE密钥管理服务解决方案。本文实现了一个IBE-XKMS原型系统,并给出IBE-XKMS和PKI-XKMS在密钥服务响应时间和SOAP消息通信量等方面的测试结果,测试结果体现了IBE-XKMS的性能优势。 陈铁明 李伟 蔡家楣 马世龙关键词:PKI IBE XKMS XML 密钥管理 基于多层增量式可扩展扇形兴趣区域的大规模DVE场景对等渐进式传输机制 被引量:12 2014年 为了解决在有限的互联网带宽上高效下载海量虚拟场景的"瓶颈"问题,文中针对基于对等网络(P2P)的虚拟场景渐进式传输的增量判断和场景下载源节点最优选择这两个关键点,首先将传统的兴趣域(Area of Interests,AOI)细化为兴趣扇区域(Sector of Interest,SOI),又将其提升为多层增量式可扩展兴趣扇形区域(Multi-Layered&Incrementally Scalable SOI,MISSOI),给出了MISSOI的分划扩展算法,并基于MISSOI提出了一个高效的整数级SOI场景下载的拾取算法;然后设计了一个基于对等网的海量DVE场景渐进式下载框架,并给出了在P2P-DVE中快速搜索场景下载源节点以及选择最优场景下载源节点的高效算法.仿真实验结果表明作者提出的方法在可视场景下载域的拾取、下载源查询成功率和下载请求失败率等性能指标上明显好于目前主流海量虚拟场景P2PDVE传输机制FLoD,更是远优于传统的Client/Server虚拟场景传输模式. 贾金原 王伟 王明飞 范辰 张晨曦 俞阳关键词:分布式虚拟现实 对等网络 基于用户相似度度量的有效社区Leader选举方法 被引量:2 2014年 社交网络社区Leader选举,即识别社区内影响力最大用户,是社交网络结构分析重要任务之一,在识别意见领袖、增进社区融合等方面具有重要的理论和应用研究价值。传统的社区Leader选举技术如User Rank和People Rank,主要基于社交网络链接分析实现,忽略了用户本身属性的相似度度量。因此得到的社区Leader不能有效保证其社区代表性。本文提出了一种新的用户关系建模方法,将传统的链接分析和用户属性相似度度量融合,有效识别具有代表性的高影响力用户。实验结果表明,提出的方法不仅可以选举出社区内部具有代表性的高影响力Leader用户,还可以通过社区Leader选举使得社区内其他用户的查询效率得到有效提高。 田秀霞 宋羊力 朱涛 王晓玲关键词:社交网络 相似度度量