樊峰峰
- 作品数:9 被引量:18H指数:2
- 供职机构:西北工业大学计算机学院更多>>
- 发文基金:国家重点基础研究发展计划国家自然科学基金陕西省自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 一种从数据库快速加载mat文件的方法
- 2011年
- Matlab和数据库技术广泛应用于大型工程应用系统中。存储在数据库中的mat文件数据须经过本地文件系统,由Matlab加载到工作空间中。每次文件数据加载过程附带两次文件IO,降低了应用软件性能。提出基于内存的mat文件数据快速加载方法,将数据库中的文件数据下载到Matlab内存缓冲区中,在缓冲区中完成文件数据扫描和加载,消除了本地文件系统的介入,显著改善了应用软件系统性能。
- 樊峰峰张延园林奕王慧文
- 关键词:MATLAB数据库基于内存
- 一种网络文件系统实时化的方法
- 本发明涉及一种网络文件系统实时化的方法,改造现有网络文件系统架构,通过为网络文件系统的客户端和服务器端增加实时参数约定、流量控制和请求调度机制,在现有网络文件系统请求/响应架构和RPC线程池机制下提供实时文件访问控制能力...
- 林奕张延园樊峰峰贾鑫王慧文
- 大规模数据清洗关键技术研究
- 随着信息技术的快速发展,数据规模的急剧增长以及数据种类的不断丰富,“数据即资产”的核心理念已经得到企业和政府机构的广泛认可。作为科技创新的原动力,“数据”在资产中的占比不断攀升,日益成为继“土地”和“资本”之后又一重大的...
- 樊峰峰
- 关键词:数据清洗
- 文献传递
- 一种网络文件系统实时化的方法
- 本发明涉及一种网络文件系统实时化的方法,改造现有网络文件系统架构,通过为网络文件系统的客户端和服务器端增加实时参数约定、流量控制和请求调度机制,在现有网络文件系统请求/响应架构和RPC线程池机制下提供实时文件访问控制能力...
- 林奕张延园樊峰峰贾鑫王慧文
- 文献传递
- 一种基于离群点检测的自动实体匹配方法被引量:10
- 2017年
- 实体匹配也叫记录匹配,是数据集成与数据清洗过程中的一项关键技术.其典型用例包括不同网站之间的商品匹配以及DBLP(Digital Bibliorgrophy&Library Project)与Scholar文献数据库之间的文献实体匹配.真实数据中广泛存在的数据质量缺陷,如错误值、缺失值和数据表达形式多样性等数据质量问题,使得实体匹配问题很具挑战性.目前流行的实体匹配算法可划分为三大类:基于规则的、基于概率的和基于学习的.电商数据中,对同一商品的描述可能差异巨大.对于这类充满表达多样性的实体匹配问题,通常并不存在简洁高效的匹配规则,训练精准的分类模型也很困难.针对这个问题,文中提出了一种基于离群点检测(Outlier Detection)的自动实体匹配方法,记为ODetec算法.首先计算记录序偶在匹配属性上的相似度,并将序偶映射为特征空间上的点;接着在特征空间中估算每个序偶的离群距离;最后根据离群距离和匹配约束,抽取匹配序偶.另外,ODetec算法采用主成分分析方法将多个存在相关性的匹配特征变换为彼此正交的主成分,突破了Fellegi-Sunter模型中属性之间须满足条件独立假设的限制,具备了更好的匹配效果和更为广泛的适用性.实验结论证实了ODetec方法的有效性.
- 樊峰峰李战怀陈群刘海龙
- 关键词:数据集成数据质量离群点检测主成分分析
- 基于Matlab的遗留系统并行化重构方法被引量:1
- 2012年
- 随着CPU多核架构的普及,应用的复杂和数据集的膨胀,基于Matlab的遗留系统中的串行程序代码无法充分发挥系统潜在的性能优势,无力应对当前大型数据集的处理应用需求。Matlab的并行计算模型为数据密集型的处理任务提供了并行支持。本文首先从系统架构扩展和业务代码并行化入手,分析遗留系统并行化重构过程要点和方法,应用案例的并行化重构实验数据表明了系统重构处理大型数据集的性能提升。
- 樊峰峰张延园林奕
- 关键词:MATLAB并行化
- 基于因子图的不一致记录对消歧方法被引量:2
- 2020年
- 实体解析(entity resolution,ER)是数据集成和清洗系统的关键基础问题.尽管有大量实体解析方法提出,但这些方法依赖隐式或显式的假设或采用不同的解析策略.对相同的实体解析任务进行处理后,它们的结论存在冲突,产生了大量的不一致记录对.在没有给定标记数据的情况下,进行这类记录对的消歧处理具有很大的挑战:一方面当标签数据缺失时,评估现存方法的解析效果并选出最优的不可行,另一方面尽管可选的方法是协调这些冲突结果以得到一致的标记方案,但有效且融合所有提示信息的消歧策略还有待研究.为此,提出了一种基于因子图的不一致记录对消歧方法.该方法首先对某给定的实体解析任务使用现存的实体解析技术进行实体解析,得到一致或不一致的记录对;接着,用核密度估计、匹配信息传递等方法输出与不一致记录对是否匹配相关的特征,并把这些建模为因子图的因子函数,该因子图是一个带因子权重的联合概率分布;最后基于最大似然估计方法估计出各因子的权重,并基于该分布对不一致记录对进行消歧处理.实验结果表明:在真实的数据集合,该方法有效且优于现存最好的方法.
- 徐耀丽李战怀李战怀王艳艳陈群
- 关键词:数据集成最大似然估计核密度估计因子图
- 基于Vega的飞行视景仿真系统设计被引量:1
- 2011年
- 在飞行视景仿真的仪表建模中,专用仪表设计软件或Vega的仪表工具存在开发成本、显示效果及系统扩展性等不足。鉴于此,研究了基于Multigen Creator/Vega的复杂飞行仪表模型的建模方法,介绍了飞行视景仿真系统的模块化结构及开发该系统所用到的关键技术。在所给出的关键技术中,详细介绍了如何设计及驱动Creator软件建立的仪表实体模型以及开发基于Vega的视景驱动程序,并给出了相关的程序代码。阐述了在三维场景中,如何实现飞行模型的运动及仪表模型各模块的精确显示。该系统可以比较真实的模拟交互式的飞行过程,提供了一个通用的仿真平台。
- 贾鑫张延园张靖樊峰峰
- 关键词:飞行仿真视景仿真
- Matlab与数据库应用中基于内存的文件加载方法
- 本发明公开了一种Matlab与数据库应用中基于内存的文件加载方法,从数据库中检索需要加载的数据文件FILE,并导入Matlab的内存缓冲区,内存缓冲区中的数据文件记为FILE<Sub>buffer</Sub>;以FILE...
- 樊峰峰张延园林奕
- 文献传递