您的位置: 专家智库 > >

崔斌

作品数:19 被引量:61H指数:4
供职机构:北京大学信息科学技术学院更多>>
发文基金:国家自然科学基金国家重点基础研究发展计划国家高技术研究发展计划更多>>
相关领域:自动化与计算机技术医药卫生更多>>

文献类型

  • 14篇期刊文章
  • 5篇会议论文

领域

  • 18篇自动化与计算...
  • 1篇医药卫生

主题

  • 6篇数据库
  • 5篇查询
  • 4篇性能评测
  • 4篇闪存
  • 4篇评测
  • 2篇信息检索
  • 2篇预测器
  • 2篇闪存数据库
  • 2篇社交
  • 2篇社交网
  • 2篇社交网络
  • 2篇数据管理
  • 2篇网络
  • 2篇协同过滤
  • 2篇分布式
  • 2篇查询性能
  • 1篇信息技术领域
  • 1篇学习算法
  • 1篇英文
  • 1篇硬盘

机构

  • 19篇北京大学
  • 3篇北京邮电大学
  • 2篇北京航空航天...
  • 1篇北京大学第一...
  • 1篇电子科技大学
  • 1篇南开大学
  • 1篇南京航空航天...
  • 1篇昆士兰大学
  • 1篇微软公司
  • 1篇北京明略软件...

作者

  • 19篇崔斌
  • 4篇陈学轩
  • 4篇吕雁飞
  • 3篇阴红志
  • 1篇孙婷
  • 1篇赵哲
  • 1篇童咏昕
  • 1篇许建秋
  • 1篇刘屹
  • 1篇徐泉清
  • 1篇邹磊
  • 1篇陈立军
  • 1篇代亚非
  • 1篇马帅
  • 1篇闫存玲
  • 1篇高军
  • 1篇姚俊杰
  • 1篇卢阳
  • 1篇马林

传媒

  • 2篇计算机研究与...
  • 2篇计算机学报
  • 2篇计算机应用
  • 2篇软件学报
  • 2篇计算机科学
  • 1篇中华检验医学...
  • 1篇北京大学学报...
  • 1篇清华大学学报...
  • 1篇计算机应用与...
  • 1篇NDBC20...
  • 1篇第30届中国...

年份

  • 2篇2022
  • 2篇2021
  • 1篇2019
  • 1篇2018
  • 1篇2017
  • 1篇2016
  • 1篇2015
  • 3篇2013
  • 2篇2010
  • 2篇2009
  • 1篇2008
  • 2篇2007
19 条 记 录,以下是 1-10
排序方式:
基于闪存的数据库性能评测与优化分析
随着闪存容量的不断提升,技术的不断成熟,闪存数据库成为数据库的热点研究领域之一.了解闪存的10特性,以及现有数据库产品在闪存上的性能瓶颈所在是闪存数据库设计改进的首要一步.目前广泛使用的是由闪存制造的固态硬盘,而固态硬盘...
吕雁飞陈学轩崔斌
关键词:闪存数据库固态硬盘数据组织资源利用
文献传递
GSO:基于图神经网络的深度学习计算图子图替换优化框架被引量:3
2022年
深度学习在各种实际应用中取得了巨大成功,如何有效提高各种复杂的深度学习模型在硬件设备上的执行效率是该领域重要的研究内容之一。深度学习框架通常将深度学习模型表达为由基础算子构成的计算图,为了提高计算图的执行效率,传统的深度学习系统通常基于一些专家设计的子图替换规则,采用启发式搜索算法来优化计算图。它们的不足主要有:1)搜索空间大,效率低下;2)缺乏可拓展性;3)难以利用历史优化结果。为了解决上述问题,文中提出了GSO,即一个基于图神经网络的深度学习计算图子图替换优化框架。该框架将计算图的子图优化建模成经典的子图匹配问题,基于计算图中算子的特征信息和计算图的拓扑结构信息,通过图神经网络模型来估计每种子图替换规则的匹配可行性和位置。基于与主流深度学习系统兼容的Python接口实现了GSO,实验结果表明:1)相比全量的子图替换规则,基于图神经网络的子图匹配预测可以最多减少92%的搜索空间;2)相比现有的启发式搜索算法,GSO可以更快地完成计算图子图替换优化(2倍以上),并使优化后的子图最多得到34%的加速。
苗旭鹏周跃邵蓥侠崔斌
面向协同过滤推荐的新型混合评分函数被引量:2
2021年
协同过滤技术在现代推荐系统中得到了广泛的应用,其基本思想是相似的用户会喜欢相似的物品。评分函数(Score Function,SF)是协同过滤推荐模型的一个关键技术,用于评估用户对物品的喜好程度。然而,目前常用的评分函数存在如下缺陷,即内积评分函数难以有效捕捉用户与用户以及物品与物品的相似度,而欧几里德距离度量函数由于几何空间限制降低了模型的表达能力。文中提出了一种融合内积相似度和欧几里德距离度量的新颖的混合评分函数,并从理论上分析了此混合评分函数的性质,证明它能有效弥补现有评分函数的不足。此外,新的混合评分函数是一项通用技术,适用于诸多现有的推荐模型(如SVD++,MF,NGCF,CML等),能够提高模型的推荐质量。最后,在6个公开数据集上进行了大量实验,验证了新混合评分函数的优越性能。
肖诗涛邵蓥侠宋卫平崔斌
关键词:推荐系统协同过滤
一种基于频繁路径特征的XML文档结构聚类算法改进实现
1引言随着XML数据的持续增加,有效处理XML数据并为决策提供信息支持变得日益重要。XML允许半结构化和层次化表示,对XML数据的挖掘不同于传统结构化数据和文本数据。XML的挖掘研
姚俊杰崔斌
文献传递
PS-Hybrid:面向大规模推荐模型训练的混合通信框架
2022年
传统的分布式深度学习训练系统大多基于参数服务器和全局规约通信框架,缺陷日益显著:参数量大,基于全局规约的去中心化通信架构由于无法存储全量模型而无法使用;通信量大,基于参数服务器的中心化通信架构面临着严重的通信瓶颈。为了解决以上问题,该文提出了面向大规模深度学习推荐模型的混合通信训练框架PS-Hybrid,分离了嵌入层参数和其他参数的通信逻辑,实现了PS-Hybrid原型系统。实验结果证明了所提出的混合通信方案能够比纯参数服务器方案取得更好的性能,在16个计算节点下比TensorFlow-PS加速48%。
苗旭鹏张敏旭邵蓥侠崔斌
一种无结构P2P系统中基于层次兴趣树的语义检索机制被引量:3
2010年
提出了一种无结构P2P系统中有效的语义检索方法:基于层次兴趣树(HIT)的语义检索。每个节点中所有的文档根据分类目录被分类成层次兴趣树,并发送至该节点所属的超级节点。同时,每个类中前n个关键词的倒排文档索引,也会依据它们的χ2统计值被发送至超级节点。当节点发送一个查询并给出类别语义相似性阈值Simth时,查询消息通过一个有效的查询路由算法被转发,结果则通过搜索HIT返回。不同的节点可以给出各自不同的Simth,其灵活性可以为每个节点提供更好的个性化服务。实验表明在无结构的P2P系统中,基于HIT的语义检索方法比以前的方法具有更好的准确性和有效性。
徐泉清代亚非崔斌
关键词:P2P语义检索查询路由语义相似性
查询性能预测方法的性能评测研究
目前的查询性能预测方法一般都是利用查询的特征、文档集合的特征以及结果列表的特征预测查询结果的平均精度(AP)。一种性能预测方法与其他方法比较时,通常采用预测的AP和查询真实AP之间的皮尔森线性相关系数或是肯德尔等级相关系...
徐赢刘屹阴红志崔斌
关键词:性能评测信息检索
基于闪存的数据库性能评测与优化分析
随着闪存容量的不断提升,技术的不断成熟,闪存数据库成为数据库的热点研究领域之一.了解闪存的IO特性,以及现有数据库产品在闪存上的性能瓶颈所在是闪存数据库设计改进的首要一步.目前广泛使用的是由闪存制造的固态硬盘,而固态硬盘...
吕雁飞陈学轩崔斌
关键词:闪存数据库
文献传递
新型数据管理系统研究进展与趋势被引量:28
2019年
随着各类新型计算技术和新兴应用领域的浮现,传统数据库技术面临新的挑战,正在从适用常规应用的单一处理方法逐步转为面向各类特殊应用的多种数据处理方式.分析并展望了新型数据管理系统的研究进展和趋势,涵盖分布式数据库、图数据库、流数据库、时空数据库和众包数据库等多个领域.具体而言:分布式数据管理技术是支持可扩展的海量数据处理的关键技术;以社交网络为代表的大规模图结构数据的处理需求带来了图数据库技术的发展;流数据管理技术用来应对数据动态变化的管理需求;时空数据库主要用于支持移动对象管理;对多源、异构而且劣质数据源的集成需求催生出新型的众包数据库技术.最后讨论了新型数据库管理系统的未来发展趋势.
崔斌高军童咏昕许建秋张东祥邹磊
关键词:分布式数据库时空数据库
闪存环境下B^+树索引重访
2010年
闪存容量的增大使在其上构建大型系统成为可能,如何构建闪存数据库也成为数据库的热点研究领域之一。索引结构是数据库中必不可少的结构之一,而B+树是最广泛使用的索引结构。这里对存储在闪存芯片模拟器及固态硬盘上的B+树性能进行了测试及分析。首先介绍了闪存的IO特点,并测试了固态硬盘的基本IO特性。接着,对B+树的插入和查询效率进行了详细测试。测试发现节点大小、缓存大小以及数据值的分布方式都会对B+树的性能带来很大影响。例如由于闪存的读取速度不对称,闪存的更新和查询操作最优块大小相差较大。这些测试结果为更好地在闪存上使用B+树索引,并进一步设计出更适合闪存的索引提供了指导。
崔斌吕雁飞陈学轩
关键词:闪存B+树索引数据库
共2页<12>
聚类工具0