您的位置: 专家智库 > >

左万利

作品数:157 被引量:825H指数:16
供职机构:吉林大学计算机科学与技术学院更多>>
发文基金:国家自然科学基金吉林省科技发展计划基金中央级公益性科研院所基本科研业务费专项更多>>
相关领域:自动化与计算机技术文化科学医药卫生自然科学总论更多>>

文献类型

  • 103篇期刊文章
  • 27篇会议论文
  • 25篇专利
  • 1篇学位论文
  • 1篇科技成果

领域

  • 137篇自动化与计算...
  • 3篇文化科学
  • 2篇医药卫生
  • 1篇机械工程
  • 1篇一般工业技术
  • 1篇自然科学总论
  • 1篇理学

主题

  • 25篇网络
  • 20篇聚类
  • 19篇本体
  • 17篇用户
  • 16篇数据库
  • 16篇网页
  • 15篇查询
  • 14篇搜索
  • 14篇索引
  • 12篇数据挖掘
  • 12篇相似度
  • 11篇引擎
  • 11篇搜索引擎
  • 11篇向量
  • 11篇矩阵
  • 10篇WORDNE...
  • 9篇深度网
  • 9篇主动数据库
  • 9篇文本分类
  • 9篇DEEP_W...

机构

  • 156篇吉林大学
  • 10篇长春工程学院
  • 8篇教育部
  • 8篇中国石油天然...
  • 5篇长春税务学院
  • 5篇长春工业大学
  • 3篇广东警官学院
  • 2篇东北师范大学
  • 2篇清华大学
  • 2篇天津科技大学
  • 2篇澳大利亚卧龙...
  • 2篇闽南师范大学
  • 1篇哈尔滨工程大...
  • 1篇北京科技大学
  • 1篇桂林电子科技...
  • 1篇中国人民解放...
  • 1篇吉林建筑工程...
  • 1篇长春科技信息...
  • 1篇长春海关
  • 1篇吉林财经大学

作者

  • 157篇左万利
  • 29篇赫枫龄
  • 29篇王英
  • 19篇左祥麟
  • 14篇王英
  • 13篇彭涛
  • 11篇王鑫
  • 10篇王鑫
  • 10篇王俊华
  • 7篇张长利
  • 6篇彭涛
  • 6篇张雪松
  • 6篇金阳
  • 6篇王萌萌
  • 5篇梁浩
  • 4篇任斐
  • 4篇刘居红
  • 4篇赵秋月
  • 4篇王辉
  • 3篇凤丽洲

传媒

  • 24篇吉林大学学报...
  • 15篇计算机研究与...
  • 10篇吉林大学自然...
  • 9篇小型微型计算...
  • 5篇电子学报
  • 4篇软件学报
  • 4篇计算机科学
  • 3篇计算机学报
  • 3篇计算机应用研...
  • 3篇NDBC20...
  • 3篇第二十五届中...
  • 2篇自动化学报
  • 2篇计算机应用
  • 2篇吉林大学学报...
  • 2篇吉林大学学报...
  • 1篇中国图象图形...
  • 1篇系统工程学报
  • 1篇清华大学学报...
  • 1篇计算机工程
  • 1篇华南理工大学...

年份

  • 1篇2023
  • 7篇2022
  • 6篇2021
  • 6篇2020
  • 1篇2019
  • 9篇2018
  • 4篇2017
  • 10篇2016
  • 9篇2015
  • 7篇2014
  • 2篇2013
  • 2篇2012
  • 1篇2011
  • 7篇2010
  • 14篇2009
  • 11篇2008
  • 15篇2007
  • 10篇2006
  • 8篇2005
  • 7篇2004
157 条 记 录,以下是 1-10
排序方式:
利用超链接信息改进网页爬行器的搜索策略被引量:14
2005年
网页爬行器在Web空间中爬行时,要面对如下两个问题:1)由于Internet上的信息量十分巨大,网络搜索引擎不可能包含整个Web网页;2)受到硬件资源的限制,它所能存储的网页是有限的。爬行器如果按照传统的宽度优先搜索策略在Web空间中爬行,它对所有的网页都采取一视同仁的态度,这样爬行的结果就导致了它所爬行回来的网页质量不高。为此,给出了利用超链接信息改进网页爬行器搜索策略的算法。该算法充分考虑了网页之间的超链接信息,克服了传统的宽度优先搜索策略的盲目性爬行。实验表明,利用该算法爬行得到的网页与某一特定主题相关的网页超过50%。
赫枫龄左万利
关键词:爬行器网络搜索引擎宽度优先搜索超链接
用有向图法解决网页爬行中循环链接问题被引量:10
2004年
提出网页构成的有向回路问题,描述了由网页构成有向图的形式定义,并给出了用有向图法发现网页构成的有向回路算法.所给定的算法能使网页爬行器避免掉入由已爬行过的网页构成的有向回路陷阱.
赫枫龄左万利
关键词:爬行器网络搜索引擎超链接有向图
一种基于离群点信息的新型无监督聚类方法被引量:1
2004年
在图像检索领域 ,聚类分析技术有着广泛应用。因为在对图像进行聚类分析时 ,通常缺少可资利用的先验知识 ,所以需要采用无监督的聚类算法。为了适应图像检索的需要 ,提出了一种新型的无监督聚类方法 ,即根据离群点信息来自动确定聚类算法的终止时机。此方法还弥补了现有聚类算法在离群点识别、使用上的缺欠。为验证其可行性 ,用其改进了 CU RE和 ROCK两个经典算法。实验表明 ,改进后的两个算法都能自动终止 ,并能取得优于以往的聚类效果。
吕天阳王钲旋左万利
关键词:无监督聚类离群点聚类算法图像检索先验知识类方
基于BERT-GCN的因果关系抽取被引量:1
2023年
针对自然语言处理中传统因果关系抽取主要用基于模式匹配的方法或机器学习算法进行抽取,结果准确率较低,且只能抽取带有因果提示词的显性因果关系问题,提出一种使用大规模的预训练模型结合图卷积神经网络的算法BERT-GCN.首先,使用BERT(bidirectional encoder representation from transformers)对语料进行编码,生成词向量;然后,将生成的词向量放入图卷积神经网络中进行训练;最后,放入Softmax层中完成对因果关系的抽取.实验结果表明,该模型在数据集SEDR-CE上获得了较好的结果,且针对隐式的因果关系效果也较好.
李岳泽左祥麟左万利梁世宁张一嘉朱媛
关键词:自然语言处理
使用分类器自动发现特定领域的深度网入口(英文)被引量:28
2008年
在深度网研究领域,通用搜索引擎(比如Google和Yahoo)具有许多不足之处:它们各自所能覆盖的数据量与整个深度网数据总量的比值小于1/3;与表层网中的情况不同,几个搜索引擎相结合所能覆盖的数据量基本没有发生变化.许多深度网站点能够提供大量高质量的信息,并且,深度网正在逐渐成为一个最重要的信息资源.提出了一个三分类器的框架,用于自动识别特定领域的深度网入口.查询接口得到以后,可以将它们进行集成,然后将一个统一的接口提交给用户以方便他们查询信息.通过8组大规模的实验,验证了所提出的方法可以准确高效地发现特定领域的深度网入口.
王辉刘艳威左万利
关键词:深度网深度网
动态自我验证的软件水印防篡改技术被引量:1
2007年
提出一种与特定语言无关的动态自我验证的软件水印防篡改技术。利用线性哈希函数对水印结构进行分块计算,既包含了结点顺序信息,又包含了结点数量信息,同时采用常量迁移技术使完整性检查隐藏在程序本身正常的逻辑判断语句中。由于水印结构的验证码是自包含的,对其篡改会导致应用程序功能错误。分析结果表明,本算法能够抵御多种形式的攻击,具有很强的保护能力。
张雪松李昕崔维力赫枫龄左万利
关键词:计算机应用软件水印动态图
基于无监督聚类的PU文本分类方法
以正例(P)和未标识实例集(U)训练分类器的文本分类算法(PU文本分类)是解决某些机器学习中训练样本获取代价过大、尤其是反例样本较难获取的实际问题。而传统的分类算法大都需要正例和反例数据集才能取得良好的效果,因此要使用传...
张长利左万利彭涛赫枫龄彭钊邵慧勇
关键词:无监督聚类PU支持向量机文本分类
文献传递
一种基于质心与本体的文本分类方法
针对传统的TFIDF模型计算根集(root set)文档特征权重的不适应性,提出了计算文档特征权重的新方法--TFIDF-2模型.另外,给出3种启发式规则用于获取根集文档的质心向量.通过计算文档与质心之间的相似度进行文本...
王辉左万利袁华
关键词:质心文本分类主题爬行本体
文献传递
主题爬行中的隧道穿越技术被引量:11
2010年
由于网络环境的复杂性和网页内容的多主题性,要想得到更多的特定主题相关网页,就要穿越那些主题不相关网页来获取更多的主题相关网页,即隧道穿越.将隧道穿越分为灰色隧道穿越和黑色隧道穿越.对于灰色隧道,在爬行过程中,将一个多主题Web页面分割成数量不多的内容块分别处理来避免由于网页整体主题不相关给该块所带来的影响.对于黑色隧道的穿越,将隧道中主题不相关网页根据其父亲页面的主题相关性赋予一个深度值,然后根据其深度值的大小进行取舍,来达到扩展主题爬行区域的目的.实验结果显示,这两种方法都达到了预期效果,所以方法是有效、稳健和实用的.
彭涛孟宇左万利王英胡亮
关键词:主题爬行网页分块TARGETLENGTH
基于可视布局信息的网页噪音去除算法被引量:42
2004年
主要探讨了网页中的噪音去除问题.针对单一页面中包含的丰富的可视信息,提出了一个更加精确的噪音去除算法:首先获得页面中各元素标记的布局信息,然后利用布局信息对页面进行划分,最后在此基础上去除噪音.与采用"布局信息"的算法相比,本文提出的算法对页面布局信息的提取更加准确,并能处理动态HTML页面.实验结果表明,该算法优于同类算法,可有效地去除网页噪音.
荆涛左万利
关键词:网页
共16页<12345678910>
聚类工具0