您的位置: 专家智库 > >

丁琳琳

作品数:25 被引量:24H指数:2
供职机构:辽宁大学信息学院更多>>
发文基金:国家自然科学基金辽宁省博士科研启动基金辽宁省教育厅高等学校科学研究项目更多>>
相关领域:自动化与计算机技术理学环境科学与工程文化科学更多>>

文献类型

  • 23篇期刊文章
  • 2篇会议论文

领域

  • 22篇自动化与计算...
  • 2篇理学
  • 1篇交通运输工程
  • 1篇环境科学与工...
  • 1篇文化科学

主题

  • 13篇查询
  • 4篇动态图
  • 4篇索引
  • 4篇标签
  • 4篇查询处理
  • 4篇查询方法
  • 3篇哈夫曼
  • 3篇哈夫曼编码
  • 3篇大数据
  • 2篇用户
  • 2篇时间序列
  • 2篇时空数据
  • 2篇索引方法
  • 2篇子图
  • 2篇网络
  • 2篇微震
  • 2篇煤矿
  • 2篇聚类
  • 2篇TOP-K
  • 2篇TOP-K查...

机构

  • 25篇辽宁大学
  • 2篇辽宁工程技术...
  • 1篇香港科技大学
  • 1篇国网辽宁省电...

作者

  • 25篇丁琳琳
  • 19篇宋宝燕
  • 7篇王俊陆
  • 2篇李正道
  • 1篇张瑞浩
  • 1篇李世峰
  • 1篇朱珠
  • 1篇刘砚秋
  • 1篇刘宇
  • 1篇任才

传媒

  • 5篇计算机科学与...
  • 4篇小型微型计算...
  • 3篇计算机应用
  • 2篇电子学报
  • 2篇计算机与数字...
  • 2篇辽宁大学学报...
  • 1篇电子技术(上...
  • 1篇计算机工程与...
  • 1篇计算机工程与...
  • 1篇安全与环境学...
  • 1篇中国矿山工程
  • 1篇2014全国...

年份

  • 2篇2024
  • 3篇2023
  • 3篇2022
  • 1篇2021
  • 1篇2020
  • 2篇2019
  • 4篇2018
  • 3篇2017
  • 1篇2016
  • 4篇2015
  • 1篇2014
25 条 记 录,以下是 1-10
排序方式:
基于改进哈夫曼编码的大规模动态图可达查询方法
图数据能够有效描述现实生活中各类事物之间的复杂关系,随着社交网络分析、生物信息网络分析等新兴应用的涌现和计算机技术的飞速发展,图的规模迅速增长,并且频繁更新,使得对大规模动态图数据的处理需求愈加迫切。可达查询是图数据管理...
丁琳琳李正道纪婉婷宋宝燕
融合实体信息和时序特征的问答式事件检测方法
2024年
针对现有问答方法在处理触发词歧义性问题上的不足,提出一种融合实体信息和时序特征的问答式事件检测方法EDQA-EITF。构建一种基于RoBERTa的问答框架,增强模型的语义表示能力;通过在模型输入序列中显示地添加实体、实体类型等先验信息,进一步帮助模型根据句子的上下文语境对触发词进行分类;采用最小门控循环单元(minimal gated unit,MGU)和Transformer编码器对输入序列中的时序依赖关系进行建模,提升模型对于句子的语义关系、句法结构的阅读与理解能力。公共数据集上的实验结果表明,所提方法在进行事件检测时具有更优的性能,有效缓解了触发词的歧义性问题。
马宇航宋宝燕丁琳琳鲁闻一纪婉婷
关键词:先验信息TRANSFORMER
基于平面图覆盖的大规模图可达查询处理
语义网络、社交网络、生物信息网络等新兴应用的涌现及普及,使得图数据的规模不断增大,针对大规模图数据的研究成为当今的研究热点和难点.可达查询是图数据处理中频繁使用的基础性查询,一些复杂的查询能够分解成包含多个可达查询的操作...
丁琳琳李雪城王大军宋宝燕
EBSN中基于用户特征的社交事件规划与饥饿问题处理被引量:1
2020年
社交事件发布参与平台越来越受到人们的关注,其主要功能是为对某个社交事件感兴趣的用户规划适合的社交活动.现有社交事件平台贪婪规划方法通常假设每个用户可以参与限定个数的事件,解决参加限定个数事件引起的时空冲突,但方法中没有考虑用户的特征,导致用户规划顺序不合理,同时,现有方法也没有考虑如何解决因资源占用出现用户无法获取事件的情况,导致用户对社交平台满意度下降.为解决上述问题,本文通过用户空闲时间与用户平均速度双重约束条件,提出一种基于用户特征的社交事件规划与饥饿问题处理方法,该方法首先提取用户特征排序的同时,结合贪心算法和Skyline思想再次排序,确定用户最佳处理顺序,在此基础上,针对社交网络事件规划中可能出现的用户饥饿问题提出救济算法,消除兴趣值不敏感的饥饿用户,在总效用值下降最小的前提下,保证了用户对社交网站的最大满意度.实验表明,本文提出的规划算法能够有效地进行社交事件规划并解决用户饥饿问题.
张翰林丁琳琳王俊陆宋宝燕
关键词:饥饿问题
大规模标签图中的动态Top-K兴趣子图查询
2018年
针对传统算法由于时间或空间复杂度过高而难以实现规模大且动态变化情况下标签图的Top-K子图查询问题,提出一种适用于大规模标签图的动态Top-K兴趣子图查询方法 DISQtop-K。该方法建立了包括节点拓扑结构特性(NTF)索引和边特性(EF)索引的图拓扑结构特性(GTSF)索引,利用该索引可有效剪枝过滤不满足限制条件的无效节点及边;基于GTSF索引提出了多因素候选集过滤策略,通过对查询图候选集进一步剪枝以获得较少的候选集;考虑到图的动态变化可能对匹配结果产生影响,提出了Top-K兴趣子图匹配验证方法——DISQtop-K,将匹配验证过程分为初始匹配和动态修正两个阶段,以尽可能保证查询结果的实时、准确。大量实验结果表明,相比RAM、RWM算法,DISQtop-K方法的索引创建时间较短且占用空间较少,能有效处理大规模标签图中的动态Top-K兴趣子图查询。
宋宝燕贾春杰单晓欢丁琳琳丁兴艳
基于平面图覆盖的大规模图可达查询处理被引量:1
2015年
随着语义网络、社交网络、生物信息网络等新兴应用的涌现及普及,图数据的规模不断增大,针对大规模图数据的研究成为当今的研究热点和难点。可达查询是图数据处理中频繁使用的基础性查询,一些复杂的查询能够分解成包含多个可达查询的操作集合,其高效处理具有重要意义。针对大规模图的可达查询,提出了一种基于平面图覆盖的大规模图可达查询处理方法。首先给出了一种基于平面图覆盖的可达标签索引方法(planar graph cover based reachability labeling index method,PGCL)。该方法将最优树作为预处理应用于平面图覆盖,通过最优树创建、最优树分解以及树分解平面化处理,得到有向无环图(directed acyclic graph,DAG)的平面图覆盖,最大限度地保留了原图的可达性信息,从而基于覆盖顶点创建二维标签,用于压缩可达传递闭包。设计了基于PGCL的可达查询算法,有效实现了大规模图的可达查询。通过大量实验证明了提出的查询方法在保证查询的高效性情况下,更好地压缩了传递闭包,提高了可达查询的处理效率。
段雨晴李世峰丁琳琳
MapReduce环境下面向用户偏好的top-k连接查询处理方法
2017年
随着互联网技术的迅猛发展和大数据时代的来临,面向海量数据的top-k连接查询返回组合得分最大(或最小)的k个连接结果,能够广泛应用到商业模式预测、用户需求分析、商品营销统计等领域.然而,在实际应用中,不同的用户对参与连接的数据表中的某些维度往往会有不同的要求,进而产生了不同的用户偏好.为了选出符合用户偏好的连接结果,需要针对用户偏好对连接后的结果进行筛选.因此,本文针对不同用户在查询时有各自不同偏好的问题,提出了在MapReduce环境下基于用户偏好的top-k连接查询处理方法.首先,在预处理阶段将两表进行连接操作;其次,提出利用skyline技术求解用户偏好的方法,通过分区间支配关系及虚拟最小点的判定,过滤不满足用户偏好的元组;最后,再通过打分函数找到需要的top-k连接查询结果.大量实验表明,本文提出的基于用户偏好的top-k连接查询处理方法能够有效满足用户偏好,具有良好的有效性和扩展性.
丁琳琳李晓燕韩百硕刘思平宋宝燕
关键词:MAPREDUCE用户偏好SKYLINE
基于HBase与Netty的煤矿微震时序大数据存储优化
2023年
在当前智能煤矿场景中,大量煤矿微震传感器所产生的时序数据呈爆炸式增长,进而对现有的存储系统及性能都有了更高的要求。目前已经存在基于分布式列族数据库HBase能够存储工业时序大数据的实例,但是由于没有考虑到特定业务场景中数据的特征关联问题,现有的策略仍然无法较好地满足煤矿微震波形时序数据的特定存储需求。针对上述问题,基于分布式存储系统HBase,利用煤矿微震波形时序数据的特征,提出了基于HBase与Netty的煤矿微震时序大数据存储性能优化(CM^(2) TS-HBase),分成四个部分,分别为数据采集层、数据预处理层、数据中转层以及数据存储层。其中,数据采集层分为离线部分与实时部分,离线部分即存储在数据中心硬盘中的历史微震时序数据文件,实时部分即部署在某煤矿的多个微震波形传感器通过网络实时地向数据预处理层进行数据缓冲;数据预处理层实现对波形时序数据的文件进行对齐、解析以及序列化操作。根据煤矿微震波形时序数据特征提出了适用于微震波形时序数据的HBase数据表结构、预分区策略以及主键优化策略,有效地解决了数据存储过程中出现的数据热点问题以及数据分散问题;数据中转层提出了基于Netty与Redis的数据转发中间件平台为整个存储体系提供异步处理机制,较好地解决了高并发存储问题;数据存储层是基于分布式数据库HBase作为存储体系的底层存储媒介。最终根据真实数据集的存储耗时证明了相较于原生存储方法(HBase API)与基于金融时序数据存储优化(FTBase),CM2T S-HBase在煤矿微震时序数据的存储性能有了明显提高。
丁琳琳王智涵顾英豪王凯璐包鑫阳
关键词:时序数据
云环境下分层的中间数据容错方法
2015年
通常在云计算框架的处理过程中会产生大量的、短暂的,同时又非常重要的中间数据。一旦有服务器失效,将会导致中间数据失效,进而影响整个任务的计算。现有的数据容错处理方法仅仅采用简单的复制策略,没有考虑中间数据的特点,会带来庞大的网络开销。因此,提出了一种有效的分层中间数据容错方法,即IDF_Support(intermediate data fault-tolerance_support)方法。通过将计算任务划分为不同类别,IDF_Support方法能够有效地处理中间数据失效。提出了分层的中间数据容错算法,分别是用于解决一个任务内部容错的中间数据容错算法(Inner_Task IDF)和用于解决任务间容错的中间数据容错算法(Outer_Task IDF)。实验结果表明,这些算法在机器出现故障的情况下提高了作业响应时间,保证了系统的可靠性。
宋宝燕李雪城任才丁琳琳
关键词:云计算副本容错算法
基于RELM的时间序列数据加权集成分类方法被引量:1
2022年
时间序列数据通常是指一系列带有时间间隔的实值型数据,广泛存在于煤矿、金融和医疗等领域。为解决现有时间序列数据分类问题中存在的含有大量噪声、预测精度低和泛化性能差的问题,提出了一种基于正则化极限学习机(RELM)的时间序列数据加权集成分类方法。首先,针对时间序列数据中所含有的噪声,利用小波包变换方法对时间序列数据进行去噪处理。其次,针对时间序列数据分类方法预测精度低、泛化性能较差的问题,提出了一种基于RELM的加权集成分类方法。该方法通过训练正则化极限学习机(RELM)隐藏层节点数量的方法,有效选取RELM基分类器;通过粒子群优化(PSO)算法,对RELM基分类器的权值进行优化;实现对时间序列数据的加权集成分类。实验结果表明,该分类方法能够对时间序列数据进行有效分类,并提升了分类精度。
赵林锁陈泽丁琳琳宋宝燕
关键词:时间序列数据小波包权值优化
共3页<123>
聚类工具0