于勇前
- 作品数:6 被引量:28H指数:3
- 供职机构:东北大学信息科学与工程学院更多>>
- 发文基金:国家自然科学基金辽宁省自然科学基金国家重点基础研究发展计划更多>>
- 相关领域:自动化与计算机技术更多>>
- 电信闭环决策支持系统的研究与实现被引量:6
- 2008年
- 针对电信数据的特点,提出了基于数据仓库的电信闭环决策支持系统的实现方案;确定了电信领域的决策分析主题及相关的模型,阐述了采用基于数据仓库的四层结构的电信闭环决策支持系统的系统架构和功能。系统以数据仓库为基础,运用联机分析处理、数据挖掘等分析决策手段实现了对电信数据多角度、多层次的查询、分析及决策功能。
- 王晓虹王国仁于勇前洪洋
- 关键词:联机分析处理数据挖掘数据仓库
- 基于引力概念的聚类质量评估算法被引量:3
- 2007年
- 为了定量分析聚类算法的聚类结果,提出了基于引力概念的聚类质量评估算法.该算法将数据空间中的数据点视为带有单位质量的质点,通过分析聚类结果中数据点之间的引力关系来评估聚类结果的质量.在一个聚类结果中,各类中的数据点之间引力大并且噪音数据受到的引力小,这样的聚类结果视为质量较高的聚类结果.相反,如果类中数据间的引力较小而噪音数据所受到的引力较大,这样的聚类结果就是一个质量不高的聚类结果.在几个不同的数据集上,对算法的有效性和高效性进行了测试.实验结果表明,该算法能在极短的响应时间内得到聚类结果评估值,正确地反映聚类结果的优劣.提出的算法可以引导聚类方法自动发现最佳聚类结果而无需人工干预.
- 于勇前赵相国陈衡岳王国仁
- 关键词:聚类引力聚类算法数据挖掘
- 基于Web的电信闭环决策支持系统的研究与实现被引量:2
- 2007年
- 通过对电信数据的分析,提出了基于Web的电信闭环决策支持系统的实现方案。确定了电信领域的决策分析主题,建立了相关的联系和模型,阐述了采用基于数据仓库的四层结构的电信闭环决策支持系统的系统架构和功能。运用联机分析处理、数据挖掘等分析决策手段实现了对电信数据多角度、多层次的查询、分析及决策功能。
- 王晓虹王国仁于勇前洪洋
- 关键词:数据仓库
- 一种基于密度单元的自扩展聚类算法被引量:9
- 2006年
- 提出一种高效的基于密度单元的自扩展聚类算法SECDU.首先将数据空间等分为若干个密度单元,再根据数据点的位置将其划分到所属的密度单元中,然后针对密度单元进行聚类.聚类首先产生在数据最密集的区域,然后向周围低密度区域延伸.聚类在延伸的过程中体积逐渐增大,密度逐渐减小,直到聚类的密度达到一个事先规定的限度时为止.算法在保留原有数据分布特性的前提下利用密度单元对数据进行压缩,并在保证具有较好效果的前提下大幅度地提高了聚类的速度.
- 于勇前赵相国王国仁陈衡岳
- 关键词:聚类分析聚类算法
- 利用自动机高效处理XML路径表达式查询被引量:8
- 2007年
- 在XML查询处理中,应用于绝大多数XML查询语言中的路径表达式在定位和查询XML数据和数据的结构关系方面具有极强的表达能力,并且由于XML数据的半结构化性,使得XML路径表达式查询的查询处理技术的研究与传统的数据库查询处理技术相比有着全新的特点和挑战.一些目前已有的查询处理技术可以用来处理路径表达式,但是查询处理中产生的大量中间结果导致了这些方法应用在大规模XML文档和复杂的路径表达式查询中时查询效率急剧下降.文中利用自动机技术设计了一个处理XML路径表达式查询的高效方法——SAM.SAM的基本思想是将路径表达式查询转化成一个与之完全等价的自动机,然后将其与从XML文档中抽象出来的模式路径相匹配.文中同时也给出了基于SAM方法的针对路径表达式中"//"操作符计算的有效解决方案.实验证明:SAM是一种非常有效的查询方法,在计算大数据量复杂路径表达式查询时具有非常高的效率,是一种实用的XML路径表达式查询方法.
- 王国仁于勇前孙冰
- 关键词:自动机查询处理
- 一种基于密度单元的聚类算法
- 随着信息技术的迅速发展,需要分析和管理的数据量迅速增大,这种趋势必然地渗透到了聚类分析领域。聚类分析是数据挖掘技术中重要的组成部分,从技术角度讲,它的主要目的是将数据空间中的数据点划分到若干个类中,其中将距离相近的数据点...
- 陈衡岳于勇前王国仁乔百友
- 关键词:聚类分析数据空间
- 文献传递