戴东波 作品数:36 被引量:102 H指数:6 供职机构: 上海大学 更多>> 发文基金: 国家自然科学基金 上海市教育委员会重点学科基金 国家重点基础研究发展计划 更多>> 相关领域: 自动化与计算机技术 一般工业技术 农业科学 文化科学 更多>>
结合使用挖掘和内容挖掘的Web推荐服务研究 随着Internet的基础结构不断扩大和其所含信息的持续增长,Internet用户越来越感觉容易在WWW服务中“资源迷向”。提高用户访问效率的方法有页面预取技术、站点动态重构技术和web个性化推荐技术等。其中web个性化... 戴东波关键词:WEB使用挖掘 WEB内容挖掘 INTERNET 数据挖掘 文献传递 基于SISSO和机器学习方法的钙钛矿结构的稳定性预测:新型容许因子建立与验证 2020年 由于钙钛矿型材料具有广泛的应用前景,因此对其结构及物理、化学性质的研究一直是材料研究领域的热点之一。其中,利用容许因子(Tolerance factor)来预测钙钛矿型材料的结构稳定性可以帮助研究者发现更多的新型功能材料,而传统的基于离子半径定义的容许因子tIR存在一定的局限性。本文基于SISSO(Sure independence screening and sparsifying operator)方法和键价模型提出一种新型的容许因子τBV,其可以有效地避免由离子半径带来的局限性。本工作使用机器学习中的决策树算法建立容许因子验证模型,实验结果表明,新型容许因子τBV可以很好地预测ABO3型化合物是否具有钙钛矿结构,并大大提高了预测精度。 胡红青 吴邵刚 郭治廷 周高锋 戴东波 魏晓 张惠然关键词:钙钛矿 一种材料性质的机器学习规则提取与评估的方法及装置 本发明涉及一种材料性质的机器学习规则提取与评估的方法及装置,方法包括以下步骤:获取材料性质的数据集;从数据集中提取机器学习的规则;对规则进行有效性验证,计算子群相似性分数,根据子群相似性分数判断规则性质;根据规则性质,制... 张惠然 代猛猛 戴东波结合使用挖掘和内容挖掘的web推荐服务 被引量:14 2005年 随着Internet的基础结构不断扩大和其所含信息的持续增长,Internet用户越来越感觉容易在WWW服务中“资源迷向”。提高用户访问效率的方法有页面预取技术,站点动态重构技术和web个性化推荐技术等。现有的大多数web个性化推荐技术主要是基于用户使用记录的数据挖掘方法,没有或很少考虑结合页面内容—这才是用户真正感兴趣的。该文提出一种结合用户使用挖掘和内容挖掘的web推荐服务,该推荐服务根据频繁最大前向访问路径,提出含有导航页和内容页的频繁访问路径图概念,根据滑动窗口内的最近用户访问页面内容和候选推荐集中页面内容相关性,来向用户提供个性化推荐服务。经推荐质量分析,这种方法具有较好的推荐优化能力。 戴东波 印鉴关键词:WEB使用挖掘 WEB内容挖掘 一种探索高熵合金相形成的端到端机器学习框架 2023年 探索高熵合金(HEAs)的相形成规则对于新型合金的设计具有明确的指导意义。提出一种端到端的框架用来从特征池和模型池中分别选择特征子集和机器学习(ML)模型。在该框架中,模型池中的模型基于其获得的特征重要性来选择适合自身的特征子集;通过评估每个模型和其对应的特征子集的拟合结果,用于建立目标任务的预测模型;最终,获得影响HEAs相形成的重要因素。研究结果显示,建立的相预测模型可将430种HEAs分成5种相,测试准确度达到87.8%,并且通过分析模型发现,当原子尺寸差异大于8.295%时,HEAs的单相固溶体的形成受到抑制。 张惠然 胡瑞 刘茜 李盛洲 张光捷 钱权 钱权 钱权关键词:高熵合金 基于Web挖掘的自适应站点优化设计 被引量:5 2006年 现有的静态 Web 站点结构不能满足人们准确地找到所需信息和享用个性化服务的要求。本文不但通过Web 日志文件的挖掘,找出用户的频繁访问路径来改进 Web 站点结构,而且分析当前访问页面与后续候选推荐页面的内容相关性,形成经过内容裁剪的个性化页面来压缩 Web 页面内容。这样,用户可快速定位到频繁访问的后续页面位置,且页面内容大多是用户感兴趣的主题信息。在此基础上,提出了一个自适应站点模型 AdaptiveSite,经过推荐质量分析,该模型具有较好的优化性能。 戴东波 印鉴关键词:WEB挖掘 自适应站点 个性化服务 基于邻居子图社交网络动态增量的演化社区发现方法 本发明公开基于邻居子图社交网络动态增量的演化社区发现方法。包括如下步骤:定义社区中节点p的邻居子图,得到节点p与其邻居节点之间的局部电阻距离,通过所述局部电阻距离,得到局部等价距离,进而通过所述局部等价距离以及所述邻居子... 李卫民 朱恒 刘炜 戴东波序列数据的相似性查询研究 序列数据是一种重要而特殊的数据类型,广泛存在于文本、Web访问序列、交易数据库中的用户购买序列以及生物数据库中的DNA和蛋白质序列等应用中。从直观上看,序列是(值,序)信息对的有序链表,区别于传统的集合数据,其不同元素间... 戴东波关键词:序列数据 相似性查询 文献传递 动态社交网络中基于电阻距离的动态演化社区发现系统及方法 本发明公开了一种动态社交网络中基于电阻距离的动态演化社区发现系统及方法。本发明系统包括主控单元、接收单元、数据预处理单元、计算单元和显示单元。本发明方法以发现各个时间片网络上的社区结构,该模型由于利用电阻距离衡量节点距离... 李卫民 朱恒 刘炜 戴东波文献传递 一种融合群体行为的用户行为预测方法 本发明公开了一种融合群体行为的用户行为预测方法。本发明以社交网络中用户历史行为和用户关系图为基础,首先使用经典社区检测算法发现社交关系图中的群体为下一步操作提供基础;对用户的历史记录进行离散化并且使用用户行为嵌入代表用户... 戴东波 胡莎莎 李卫民文献传递