王悦 作品数:60 被引量:229 H指数:6 供职机构: 北京大学 更多>> 发文基金: 国家自然科学基金 国家高技术研究发展计划 国家科技支撑计划 更多>> 相关领域: 自动化与计算机技术 医药卫生 经济管理 理学 更多>>
干预规则挖掘的任务分类和三项技术进展 被引量:4 2010年 介绍了亚复杂系统中干预规则的基本概念和挖掘方法,提出了干预规则挖掘技术的分类准则,综述了三项干预规则挖掘技术的最新进展,包括疾病状态干预技术、基于数据流的未知干预发现技术和基于并行事件序列的干预规则挖掘。在实践基础上分析了干预规则挖掘的难点,展望了进一步的研究工作。 唐常杰 段磊 王悦 杨宁 朱军 代礼关键词:数据挖掘 离子液体中铀酰配合物的光谱与电化学研究 近年来,核电在中国大规模发展,可以预计到未来数年内核燃料的供应量将会增长。出于可持续发展的考虑,需要经过核燃料循环过程将乏燃料重复利用。而离子液体作为绿色溶剂,将其应用于乏燃料后处理过程中,尤其是电化学分离方面的应用得到... 王悦关键词:乏燃料后处理 离子液体 循环伏安 铀酰配合物 基于流信息距离的多文本流热点挖掘 被引量:5 2011年 把文本流中的热点区分为局部热点和全局热点,分析了二者的相关性,并将Kolmogorov复杂度应用于多文本流中的热点挖掘.首先,定义了基于Kolmogorov复杂度的冗余信息的概念,并论证了文本流存在局部热点的必要条件是冗余信息超过某个阈值;其次,基于条件Kolmogorov复杂度提出了一个相似性度量指标——流信息距离(stream information distance,简称SID),以衡量不同文本流之间的相似度;并借鉴计算生物学领域中的种系发生树的思想,提出了一种基于层次聚类的多文本流全局热点挖掘启发式算法.在合成和真实数据集的实验,验证了算法的收敛性、有效性和规模可伸缩性. 杨宁 唐常杰 王悦 陈瑜 郑皎凌 李红军关键词:冗余信息 在不确定数据集上挖掘优化的概率干预策略 被引量:6 2011年 提出了不确定干预分析模型,主要工作包括:(1)建立了用于多维不确定数据分析的不确定监测点模型(uncertain surveillance);(2)建立了基于不确定监测点的不确定干预策略及挖掘评价算法;(3)在真实数据及仿真数据上对所提出的两种算法作了大量实验比较,验证了所提出的干预策略评价优化算法具有较高精度,效率比朴素方法高出3个数量级,适合在实际系统中处理海量干预评价. 王悦 唐常杰 杨宁 张悦 李红军 郑皎凌 朱军关键词:不确定数据 数据挖掘 海量数据分析 基于基因表达式编程的进化模式定理 被引量:11 2009年 基因表达式编程(GEP)从提出迄今尚无完整的理论体系,严重阻碍了GEP的发展。为解决该问题,首先从理论上深入地研究了GEP计算模型:定义了GEP基因模式及相关的概念,采用概率办法详细分析了单基因GEP应用实例在进化过程中各算子的作用,根据分析结果推导出GEP模式定理,通过实验验证了GEP模式定理的正确性。GEP模式定理的提出,为GEP算法改进评估提供了量化的依据。 王悦 唐常杰 杨宁 陈瑜 徐开阔关键词:基因表达式编程 基于谱聚类的多数据流演化事件挖掘 被引量:8 2010年 为解决从多数据流挖掘演化事件这一难题,提出了一种多数据流上的谱聚类算法SCAM(spectral clustering algorithm of multi-streams),其相似矩阵基于耦合度构造,而耦合度衡量了两个数据流的动态相似性.提出了算法EEMA(evolutionary events mining algorithm),该算法基于聚类模型的演变挖掘多数据流的演化事件.定义了聚类模型凝聚度,用以衡量聚类的紧凑程度,并证明了凝聚度的上界.基于到上界的距离和规范化相似矩阵的特征间隙,定义了聚类模型质量,并作为EEMA的优化目标自动地确定聚簇数k.设计了O-EEMA作为EEMA的优化实现,其时间复杂度为O(cn2/2).在合成和真实数据集上的实验结果表明,EEMA和O-EEMA是有效的、可行的. 杨宁 唐常杰 王悦 陈瑜 郑皎凌关键词:多数据流 基于上下文感知的智能交互系统模型 被引量:58 2005年 上下文感知是提高人机交互智能性的重要途径 ,上下文信息能否在计算过程中真正发挥其作用主要取决于两个方面 :一是从交互环境中提取和形成上下文 ;二是协调控制各种上下文与高层应用之间的通信 文中围绕这两个问题展开讨论 ,提出了一种上下文感知和调度的策略 ,并建立了一个基于上下文感知的智能交互系统结构模型 介绍了按照所述策略和模型构建的实例系统 。 岳玮宁 王悦 汪国平 王衡 董士海关键词:上下文感知 智能交互 普适计算 UTR^*-Tree:受限网络中移动对象不确定轨迹索引模型 被引量:3 2010年 受限网络中移动对象不确定轨迹的有效索引是移动对象数据库中的研究重点。针对现有方法的不足,提出了一种新的不确定轨迹索引结构UTR*-Tree。该索引结构采用静态和动态相结合存储管理移动对象,将变化极小的受限道路网络作为静态部分使用2维空间R*-Tree进行管理;将移动对象位置则作为动态信息采用R*-Tree和Hash数组协同管理。借助该结构,移动对象数据库不仅可以快速地处理对移动对象过去可能位置的查询,而且能够对其现在及将来的可能位置进行高效的查询处理。实验结果表明同目前有代表性的轨迹索引结构UTR-Tree相比,该索引结构在维护性能上提高了一个数量级,在查询性能上平均提高了约25%。 李红军 唐常杰 乔少杰 代术成 王悦 郑皎凌关键词:移动对象数据库 不确定性 索引 一种基于荧光标记转基因动物模型评价化学物质生殖发育毒性的方法 本发明提供了一种基于荧光标记转基因动物模型评价化学物质生殖发育毒性的方法,包括以下步骤:首先对受试动物进行荧光蛋白标记;然后将标记的受试动物用待测化学物质进行染毒;最后利用荧光成像技术评价化学物质对受试动物的组织发育和/... 贾晓静 王悦 肖寒 杨磊 张照斌文献传递 基于扰动的亚复杂动力系统因果关系挖掘 被引量:2 2014年 传统因果分析方法主要是基于具有分布预设的概率模型,但动力系统通常是存在反馈的非线性系统,不适合采用概率方法进行分析.针对这一问题,该文提出了基于扰动的亚复杂动力系统因果分析方法,主要工作包括:(1)采用基因表达式编程的函数拟合方法对动力系统时间序列进行差分方程拟合,减免了关于数据分布模型的预设;(2)基于得到的拟合函数,通过对自变量的扰动来计算因变量的相应波动,提出了根据扰动和波动的数值关系来判断自变量和因变量之间因果关系的判断准则,并基于该准则提出了因果关系挖掘算法和挖掘结果可信度验证方法;(3)在合成数据和真实数据上进行了翔实实验,结果表明该文所提出的算法能挖掘出合理因果关系,在不同数据规模情况下能得到一致挖掘结果.与两种基于概率统计的因果分析方法进行了对比实验,结果表明当系统要素多于两个时,该文的算法仍然能够得到多个要素间正确的因果关系,而两种基于概率统计的方法则无法挖掘出正确的因果关系. 郑皎凌 唐常杰 乔少杰 杨宁 李川 陈瑜 王悦关键词:因果关系分析 函数拟合 数据挖掘