林琛 作品数:5 被引量:19 H指数:2 供职机构: 复旦大学信息科学与工程学院计算机与信息技术系 更多>> 发文基金: 国家自然科学基金 国家高技术研究发展计划 上海市科委科研计划项目 更多>> 相关领域: 自动化与计算机技术 更多>>
EAPSC:有效聚类skyline对象集方法 2009年 提出SkyCluster的概念,对skyline对象进行基于密度的聚类.另一方面,由于skyline查询和聚类处理均是CPU-敏感的.因此,为了提高获取SkyCluster的效率,提出一种有效聚类skyline对象集的方法EAPSC.EAPSC算法基于文章给出的SLT索引树,并利用SLT索引树的多个有效性质来快速产生所有的SkyCluster聚类.理论分析和实验结果表明,该方法具有有效性和实用性. 黄震华 向阳 林琛关键词:SKYLINE查询 聚类处理 索引树 查询优化 有效降低分布式SKYLINE查询网络传输代价 被引量:1 2010年 分布式网络中的skyline查询是近年来信息检索学科的一个研究重点.目前大多数研究工作均没有考虑在分布式网络中,如何有效降低skyline查询的网络传输代价.为此,提出一种在分布式网络中,有效降低skyline查询传输代价的方法RTCSQDN(Reducing the Transferring Cost of Skyline Queries over Distributed Networks).RTCSQDN算法充分利用父空间skyline对象集与子空间skyline对象集间的语义关系通过三个阶段来平衡网络传输量和查询时间开销.同时,文章给出一种新颖的多维对象传送策略PTGPV(Policy for Transferring Grouping Position Values)来避免直接传送skyline对象本身,从而最小化数据传输量.详细的理论分析和大量实验评估表明,文章给出的算法具有有效性和实用性. 黄震华 向阳 林琛关键词:信息检索 SKYLINE查询 分布式网络 SKYLINE查询解析 被引量:1 2009年 现有的研究工作只考虑如何对单个底层关系表进行skyline计算,即它们假定用户所提交的skyline查询不涉及任何传统的关系操作,并且所有skyline维度均落入同一个关系表中.显然,在实际应用中,由于这种假设的不成立,使得在多数情况下用户查询的效率极其低下.基于此,将skyline计算作为一个特殊的关系操作符,研究它与传统关系操作符间执行顺序变换的等价规则.从而,利用这些等价变换规则,通过改变skyline操作符与传统关系操作符之间的执行顺序来有效提高查询的效率.同时,给出充分的理论证明来论证所给等价变换规则的正确性,并通过实验验证其有效性. 黄震华 向阳 林琛 孙圣力关键词:数据库 SKYLINE查询 查询优化 WEB环境下的社会网络挖掘研究 社会网络研究是理解社会现象,预测人类行为,分析社会结构的重要工具。进入Web2.0时代以来,庞大的Web用户群体、频繁的Web用户互动和海量的Web内容构成了巨大的Web社会网络,使Web环境下的社会网络挖掘成为信息技术... 林琛关键词:WEB环境 文本数据 多模网络 文献传递 一种基于紧密度的半监督文本分类方法 被引量:13 2007年 自动的文本分类已经成为一个重要的研究课题。在实际的应用情况下,很多训练语料都只有一个数目有限的正例集合,同时语料中的正例和未标注文档在数量上的分布通常也是不均衡的。因此这种文本分类任务有着不同于传统的文本分类任务的特点,传统的文本分类器如果直接应用到这类问题上,也难以取得令人满意的效果。因此,本文提出了一种基于紧密度衡量的方法来解决这一类问题。由于没有标注出来的负例文档,所以,本文先提取出一些可信的负例,然后再根据紧密度衡量对提取出的负例集合进行扩展,进而得到包含正负例的训练集合,从而提高分类器的性能。该方法不需要借助特别的外部知识库来对特征提取,因此能够比较好的应用到各个不同的分类环境中。在TREC’05(国际文本检索会议)的基因项目的文本分类任务语料上的实验表明,该算法在解决半监督文本分类问题中取得了优异的成绩。 郑海清 林琛 牛军钰关键词:计算机应用 中文信息处理 文本分类 支持向量机