乐嘉锦
- 作品数:214 被引量:868H指数:15
- 供职机构:东华大学更多>>
- 发文基金:国家自然科学基金上海市自然科学基金江苏省高校自然科学研究项目更多>>
- 相关领域:自动化与计算机技术经济管理文化科学轻工技术与工程更多>>
- RFID数据清洗技术研究进展被引量:1
- 2022年
- 无线射频识别(RFID)技术是一种自动识别方法,它依赖于称为RFID标签的无线电转发器快速存储和检索数据。由于RFID标签与读写器通信时无需直接接触,这样为短时间内采集大量的数据提供了可能。但是,采集到的数据也产生了诸如漏读、多读、冗余、乱序等问题,如何在短时间内高效地清洗产生的大规模RFID数据成为数据库领域的重要研究课题。对现有的RFID数据清洗技术进行了综述。首先,给出了RFID系统与RFID数据清洗问题的有关定义与描述,列出了典型的数据集与评价标准,从相关技术的分类、子类、基本思想、优势、局限、适用场景等方面详细比较和总结了现有的RFID数据清洗工作,同时对相关应用系统进行比较分析。然后,针对漏读数据清洗、多读数据清洗、冗余数据清洗、乱序数据处理等关键问题,对已有的研究进行了详细的比较和总结。最后,从RFID原始数据与基准数据集构建、加密与隐私保护数据的清洗策略、数据采集准确率、清洗结果的时效性、场景自学习等方面提出了RFID数据清洗领域未来五个值得关注的研究方向。
- 王健乐嘉锦
- 关键词:冗余数据
- 一种列存储数据仓库中的数据复用策略被引量:8
- 2013年
- 数据复用是数据仓库管理中节约存储空间、提高查询效率的重要手段.列存储技术将来自同一属性的数据连续存储,极大地提高了数据仓库等分析型应用软件的性能,同时增加了复用的可行性和灵活性.为此,提出了一种列存储数据仓库中的数据复用策略.首先,利用模式匹配技术发掘候选可复用列,排除大量无法复用的数据列,在此基础上对候选可复用数据进行筛选和过滤,大大降低复用数据检测的复杂度.针对确定的可复用数据,提出了基于列存储的复用实现策略,分别给出了原始数据列、压缩数据列及索引数据列的复用实现方法.最后提出了基于复用数据的查询实现技术.在大规模数据仓库基准数据集上的实验结果验证了数据复用策略在减少存储量、节省数据装载时间及提升查询性能方面的有效性.
- 王梅周娇玲乐嘉锦
- 关键词:数据复用数据仓库
- 分布式环境下的关系型XML查询优化
- 2011年
- XML数据查询是XML相关技术中一项的重要技术。与普通的XML查询方法不同,关系型XML查询不需要路径表达式,给查询者带来了便利,然而与此同时也带来了计算量增大的问题。针对该问题,给出了一种在分布式环境下基于部分求值的解决方案,并提出了优化算法。实验表明,该算法不仅能提高关系型XML查询的效率,而且能提高查询的适应性,使得查询可以在更为苛刻的条件下进行。
- 孙源鹏乐嘉锦
- 关键词:XML分布式计算部分求值
- 高血压疾病纵向协同管理体系建设和探索被引量:1
- 2019年
- 结合解决我国高血压疾病管理存在的主要问题,应用现代信息技术,开发基于互联网运行的纵向协同管理系统,即可尝试构建一套从下而上的自我教育、预防干预、健康体检、医院治疗和从上而下的医院治疗、社区随访、家庭帮助、自我管理的纵向协同管理体系,降低高血压疾病的患病率、高增长趋势和高危害性;提高高血压管理的知晓率、治疗率和控制率,改善患者生活质量。
- 赵艳乐嘉锦
- 关键词:慢病管理双向转诊随访
- 基于度量波动时间框架的流立方体研究被引量:1
- 2011年
- 流数据存在于很多动态环境中,一般具有多维属性,它能够实时描述系统状态,蕴含着大量信息。为了能近实时地对流数据进行分析,引入流立方体来对流数据进行建模,利用增量更新保证了立方体快速刷新。流数据的规模很大,为了节省存储空间,利用度量的波动性质提出一种新的时间框架。该时间框架能够在保持历史数据有效信息的前提下,缩减物化单元,减小立方体存储代价。
- 王立乐嘉锦
- 关键词:流数据数据立方体
- 面向大数据的自然语言查询接口实现方法
- 本发明提供了一种面向大数据的自然语言查询接口实现方法。本发明将中文自然语言查询转化为SQL或BSON的转化策略,根据自然语言生成语义依赖树,再根据既定规则将语义依赖树转化为查询树,通过解析查询树获得自然语言对应的SQL及...
- 王梅乐嘉锦朱扬勇陈德华潘乔郑晓东
- 文献传递
- 列存储数据区级压缩模式与压缩策略选择方法
- 压缩技术是列存储数据管理的重要研究内容之一。目前多数方法对同一列数据使用单一压缩方法进行压缩,忽略了数据的局部分布特性,极大地影响了压缩性能。该文提出一种区级压缩模式,并在此模式下提出基于学习的压缩策略选择方法。首先该文...
- 王振玺乐嘉锦王梅刘国华
- On-Demand数据广播环境下实时有序查询处理
- 2010年
- 在On-Demand数据广播环境下,广播服务器基于用户发送的数据请求等信息进行调度决策来满足用户的数据访问需求。在很多实际应用中,用户的数据请求需要在一定时间段内得到满足,即数据请求是有截止期的。现有研究只考虑了具有截止期约束的单个数据请求的调度问题,而实时查询处理即用户以查询为单位依次发送多个数据请求的研究尚未得到足够的关注。本文重点研究了On-Demand数据广播环境下如何有效地处理实时有序查询这一问题。基于对该问题的分析,定义了一类新的调度问题ROBS并证明了ROBS的Off-Line版本是NP-Hard的;提出了一种新的考虑查询语义的On-Line调度算法OL-ROBS,该算法通过综合考虑数据请求个数、查询截止期和查询剩余数据请求个数来确定待广播数据项的优先级;为提高OL-ROBS的执行效率,设计了一种裁减算法,用以减少调度决策的搜索空间。模拟实验将OL-ROBS与目前最为有效的实时数据请求调度算法Sinθ-进行了比较,结果显示OL-ROBS具有更低的错过截止期比率。
- 王洪亚刘晓强何浩源宋晖肖迎元乐嘉锦
- 关键词:数据广播调度算法
- 多中心临床大数据平台建设及深度应用被引量:6
- 2018年
- 多中心临床研究是多中心、多学科对同一临床问题开展广泛协作临床研究的主要途径。传统多中心临床研究主要存在样本量偏小和临床科研相对封闭、开放程度不高的问题。为此,结合了新近兴起的大数据与云计算等技术,将物理上分散的各医院临床中心融合成逻辑上统一的临床大数据,构建了多中心临床大数据应用平台。介绍了多中心临床大数据平台的总体框架设计,详细阐述了平台各个子系统,分析了临床大数据平台的深度应用。
- 朱立峰刘淑君陈德华乐嘉锦
- 关键词:多中心临床研究
- Sybase移动和嵌入式数据库的同步技术被引量:14
- 2002年
- 数据的同步技术是保持移动和嵌入式数据库一致性的一项关键技术 .本文根据Sybase提供的两种同步技术 (SQLRemote和Mobilink) ,提出了利用基于消息的同步技术 (SQLRemote)和利用基于会话的同步技术 (Mobilink)的两种应用方案 ,并对此进行了分析 .
- 王宗江乐嘉锦
- 关键词:移动数据库REMOTEMOBILINK嵌入式数据库同步技术