李孟娟 作品数:7 被引量:18 H指数:3 供职机构: 云南师范大学图书馆 更多>> 发文基金: 国家自然科学基金 云南省教育厅科学研究基金 云南省高层次科技人才培引工程 更多>> 相关领域: 自动化与计算机技术 电子电信 更多>>
融合RBF的二值神经网络推荐模型 被引量:6 2019年 随着网络通信技术的快速发展和互联网信息资源的大规模扩张,信息过载问题日益严重,传统的信息服务使得这一问题得到缓解。但对具有海量条目的信息,用户要根据自己的喜欢找到想要的目标并不容易。为了解决该问题,提出一种融合径向基函数(RBF)的二值化卷积神经网络的推荐模型。该模型建立在卷积神经网络的基础上将输入数据预处理为0或1,极大节省数据存储空间并提高推荐效率。利用RBF建立可信任的亲属网络,根据亲属网络中的相似用户筛选出有用信息并进行分析做出相应推荐。针对电影推荐进行实验,实验结果表明该方法是有效可行的。 雷妍 贾连印 李孟娟 李孟娟 游进国 游进国Dtrie-allpair:高效的集合T-覆盖连接算法 被引量:2 2012年 传统的T-覆盖连接算法会因生成的候选集庞大而导致系统性能降低,为此,文中提出了一种基于trie的动态索引结构——DTI结构,并构建了基于该结构的相似度连接算法——Dtrie-allpair算法.通过该算法可以直接得到allpair连接的结果,不产生任何候选集,有效解决了高候选集产生的问题,克服了传统算法因生成并验证候选集而带来的开销.文中还研究了数据库中记录的顺序及记录中元素顺序对Dtrie-allpair算法性能的影响,并在msweb、msnbc两个数据集下对Dtrie-allpair算法与All-pair、PPJoin算法进行对比.结果表明:Dtrie-allpair算法具有明显的优势,覆盖阈值较小时优势更明显;对msweb数据集,阈值为2时,Dtrie-allpair算法的效率相对于All-pair、PPJoin算法提高近两个数量级;通过对数据集进行频率降序和长度升序组合预处理可大幅降低Dtrie-allpair算法访问的trie结点数量,从而显著提升性能. 贾连印 奚建清 李孟娟 游进国 刘勇 苗德成基于均衡割的无叉积分区连接算法 2016年 连接序问题是数据库查询优化中最重要且最具挑战性的问题.传统的动态规划算法通常具有指数级复杂度.基于图形分割的相关理论,提出均衡割分区算法(BCP),通过均衡割将查询图分割成大小相对均衡的分区,避免一次性处理所有连接的关系.BCP算法分区不会产生叉积,并且可以轻易地集成进任何查询优化器中.在Postgre SQL上实现了该算法,并和Postgre SQL现有的分区算法——迭代动态规划算法(IDP)进行对比.实验结果表明:对25个关系以内的随机连接查询,BCP不仅在平均效率上优于IDP算法,而且对分区大小变化也有更好的适应性. 贾连印 章永彬 李孟娟 丁家满 游进国 陈玮关键词:查询优化 基于状态视图的高效Hilbert编码和解码算法 被引量:7 2020年 Hilbert曲线是高维降到1维的重要方法,具有较好的空间聚集和空间连续性,在地理信息系统、空间数据库、信息检索等方面有广泛的应用。现有Hilbert编码或解码算法未考虑输入数据对编码或解码效率的影响,因此将不同输入数据同等对待。为此,该文通过设计高效的状态视图并结合快速置位检测算法提出高效的免计前0的Hilbert编码算法(FZF-HE)和免计前0的Hilbert解码算法(FZF-HD),可快速识别输入数据前部为0而无需迭代计算的部分,从而降低迭代查询次数及算法复杂度,提高编解码效率。实验结果表明,FZF-HE算法和FZF-HD算法在数据均匀分布时效率稍高于现有算法,而在数据偏斜分布时效率远高于现有算法。 贾连印 陈明鲜 李孟娟 李孟娟 游进国关键词:HILBERT曲线 数据偏斜分布下的二维Hilbert编解码算法 被引量:3 2022年 高效的Hilbert曲线的编解码算法作为Hilbert曲线应用的基础,具有重要的研究意义。现有算法多未考虑数据偏斜分布的影响,因此在数据偏斜分布时效率较低。该文发现:对于特定的前m阶坐标,其对应的前m阶编码值与其第1阶编码值呈现特定的倍数关系;对于特定的前m阶编码值,其对应的前m阶坐标与其第1阶坐标呈现特定的倍数关系。基于这一发现,在融合高效位操作、快速置位检测等技术的基础上,提出了跳过前m阶的编码(skipping the first m orders Hilbert encoding, SFO-HE)算法和跳过前m阶的解码(skipping the first m orders Hilbert decoding, SFO-HD)算法。这2个算法无需对前m阶逐阶编解码,可有效提高数据向Hilbert空间4个顶点偏斜时的编解码效率。扩展实验表明:该文算法对数据偏斜分布具有更好的适应性,在特定偏斜分布时效率大幅优于现有算法。 贾连印 孔明 王维晨 李孟娟 游进国 丁家满关键词:HILBERT曲线 编解码算法 局域网防IP冲突的多叉树算法 被引量:1 2018年 针对网络中IP重复导致冲突的问题,根据实际情况对网络多叉树进行半自动构建,充分将局域网防IP冲突过程与多叉树算法进行融合,提出了局域网防IP冲突的多叉树算法,并且按照多叉树算法中树的构建、查询等对文中算法进行了阐述,使用查询模拟碰撞发生对校园网络存在IP冲突隐患进行监测,并将其解决碰撞冲突问题进行分析,为网络管理中的防IP冲突提供参考和借鉴. 王宁邦 徐博 徐博 洪亮 高大帅 李孟娟 彭程 丁俊美关键词:网络管理 防冲突算法 基于OpenMP的并行集合包含查询算法 被引量:1 2016年 集合包含查询分为子集、等值和超集3种查询,在多个领域有重要的研究意义和应用价值.随着集合数据集规模的不断增大,迫切需要提高集合包含查询的效率.集合包含查询并行化是解决这一问题的一条途径,基于OpenMP提出并行子集、等值和超集查询算法,这些算法采用反向索引结构,通过for循环并行化实现查询间的并行执行.为提高算法效率,设计2个高效的并行共享数据结构:1PVEC结构:用于存储并行查询结果.2CountArr数组:针对超集查询,用于对反向列表中的元素计数,并行线程可异步地对这两个结构进行访问.在MSWEB和DBLP 2个数据集上进行扩展实验,结果表明,实现的3种并行集合包含查询具有较高的效率,对3种查询在MSWEB数据集上均可达到4X以上的加速比. 李孟娟 贾连印 陈文焰 吕晓伟 章露露关键词:OPENMP