王水
- 作品数:16 被引量:56H指数:6
- 供职机构:宁波大红鹰学院更多>>
- 发文基金:宁波市自然科学基金浙江省教育厅科研计划国家自然科学基金更多>>
- 相关领域:自动化与计算机技术文化科学医药卫生政治法律更多>>
- 不产生候选项集的TOP-K高效用模式挖掘算法被引量:9
- 2015年
- 目前TOP-K高效用模式挖掘算法需要产生候选项集,特别是当数据集比较大或者数据集中包含较多长事务项集时,算法的时间和空间效率会受到更大的影响.针对此问题,通过将事务项集和项集效用信息有效地保存到树结构HUP-Tree,给出一个不需要候选项集的挖掘算法TOPKHUP;HUPTree树能保证从中计算到每个模式的效用值,不需要再扫描数据集来计算模式的效用值,从而使挖掘算法的时空效率得到较大的提高.采用7个典型数据集对算法的性能进行测试,实验结果证明TOPKHUP的时间和空间效率都优于已有算法,并对K值的变化保持平稳.
- 王乐冯林王水
- 关键词:频繁项集数据挖掘
- 从道藏目录进MySQL说Excel公式和数据库范式技巧
- 2012年
- 以《道藏目录》导入MySQL数据库并在PHP网页上显示为例,讲述中文信息在数据转换时所涉及的MySQL相关技术和范式、Excel函数等技巧。
- 贾满磊王水
- 关键词:MYSQLEXCEL字符集范式
- 一种不确定数据集上频繁模式挖掘的近似算法被引量:8
- 2014年
- 为提高不确定数据集上频繁模式挖掘的效率,针对已有算法在判断是否需要为头表中的某项创建子头表时的计算量比较大的问题,给出一个近似挖掘策略AAT-Mine,以损失小部分频繁项集为代价,提高整个算法的挖掘效率。采用三个不同的典型数据集进行了算法的测试,分别与目前最好的算法和典型算法进行性能对比。实验结果验证了近似算法AAT-Mine的时空效率都得到了提高。
- 王水祝孔涛王乐
- 关键词:数据挖掘频繁项集
- 一种自动分级装置
- 本发明涉及铁皮石斛筛选技术领域,特别地涉及一种自动分级装置,适用于筛选通过传输带运输的铁皮石斛,其中,自动分级装置包括:分级单元,包括:多个托盘装置,用于承载铁皮石斛;多个电机装置,每个电机装置都具有相应的托盘装置;图像...
- 李永平田思王水李兴远程萍刘欣欣彭绪山
- 文献传递
- 人工生命进化仿真系统研究综述被引量:1
- 2014年
- 进化仿真实验是人工生命领域研究的主要途径,其成果可广泛应用于多主体演化计算、生化过程仿真、军事演练、群体行为仿真、复杂系统研究等,而其计算量往往很大。为比较全面地总结人工生命仿真领域的主要研究特点、方向和难点等问题,对现有进化仿真相关文献通过文献计量、摘要等系统化综述手段进行分类、比较和概括,发现:为解决进化仿真的大计算量问题,需要针对其紧密时空耦合的计算特点,借鉴数据库技术的事务管理概念,研究进化仿真中的分区方法和事务管理机制;应分别在同步节点和异步节点的条件下,研究基于各种时间管理策略指导下的优化调度算法,及异常情况下的补偿措施,并探索动态的分区方案和负载均衡策略,乃至设计云模式下分布式仿真的部署方案;最后归纳出进化仿真研究的一般思路。
- 王水王乐
- 关键词:人工生命多主体系统分布式仿真调度算法
- 基于Web3.0和SNS的创新实践型教学体系的研究与试点
- 2013年
- 鉴于目前计算机相关专业多次受到"红牌专业"、"黄牌专业"警告的现状,为解决教学过程中学生的兴趣缺乏和动力不足而导致的应用能力弱的问题,以革命性的Web3.0技术和SNS(社交网络)为平台,以微应用、手机应用等为创新内容,构建创新实践型教学体系,实现以"创新微应用"为主要实践教学内容,以"创新软件产出"为主要考核内容的教学模式。
- 彭绪山祝孔涛李兴远王水
- 关键词:实践教学社交网络
- 可视化展示高频金融时间序列相关性的方法和装置
- 本发明公开了一种可视化展示高频金融时间序列相关性的方法,其步骤包括:获取n组高频金融数据序列,n≥2;对高频金融数据序列进行处理,获得n×n维的矩阵序列;采用滑动窗口方式和考察宽度为w处理矩阵序列,形成包含n×n×w个项...
- 王水王乐
- 文献传递
- 模糊聚类和logistic回归对试管婴儿成功因素的分析研究被引量:6
- 2015年
- 目的分析影响试管婴儿成功率的关键因素,评价关键因素的相对重要性。方法通过采集试管婴儿医疗数据,确定影响因素并进行离散化,建立了妊娠结果对影响因素的logistic回归模型。运用优势分析法定量评价关键因素的相对重要性。最后对所有样本进行加权模糊聚类,分为普通和高危两组患者并比较两组医学特征的异同。结果对logistic回归模型进行统计学假设检验,得到年龄、移植胚胎数、促排卵药物(Gn)总量、输卵管和卵巢为影响成功率的关键因素。其重要性顺序依次为:移植胚胎数、年龄、促排卵药物(Gn)总量、输卵管和卵巢。对聚类数据进行统计学假设检验,得到两组患者在不孕状态、子宫和卵巢方面差异具有统计学意义,在盆腔、输卵管、子宫内膜异位和精子质量方面差异不具有统计学意义。结论 logistic回归模型适用于分析影响试管婴儿成功率的关键因素。
- 徐颖杨海琼王水
- 关键词:试管婴儿LOGISTIC回归模型模糊聚类
- 基于模式增长方式的高效用模式挖掘算法被引量:10
- 2015年
- 高效用模式挖掘是数据挖掘领域的一个重要研究内容;由于其计算过程包含对模式的内、外效用值的处理,计算复杂度较大,因此挖掘算法的主要研究热点问题就是提高算法的时间效率.针对此问题,本文给出一个基于模式增长方式的高效用模式挖掘算法HUPM-FP,该算法可以从全局树上挖掘高效用模式,避免产生候选项集.实验中,采用6个典型数据集进行实验,并和目前效率较好的算法FHM(Faster high-utility itemset mining)做了对比,实验结果表明本文给出的算法时空效率都有较大的提高,特别是时间效率提高较大,可以达到1个数量级以上.
- 王乐熊松泉常艳芬王水
- 关键词:频繁项集数据挖掘
- 国内微博研究的发展与机遇被引量:11
- 2012年
- 为全面了解当前国内微博研究的发展现状,以期刊论文、学位论文、基金项目、专利、SCI/EI收录论文等题录信息为基础数据,使用文献计量、统计处理等方法,总结微博研究的领域、热点及各项属性的统计分布规律;发现国内微博研究已经初具规模,并有实质性的成果,但偏重于应用层面及新闻、传媒领域,缺乏专业性和多样性,在深度和广度上有待提高;文本挖掘、趋势分析和预测、人群行为研究、跨专业应用研究等是热点和潜力方向。
- 孙晓莹李大展王水
- 关键词:社交网络