李渝勤
- 作品数:22 被引量:84H指数:4
- 供职机构:北京信息科技大学更多>>
- 发文基金:国家自然科学基金北京市教育委员会科技发展计划北京市教委科技发展计划更多>>
- 相关领域:自动化与计算机技术经济管理更多>>
- TRS CD-Web出版系统
- 1998年
- WWW是目前Internet上发展最快的领域,随着Web的迅猛发展,数据库连接产品与Internet/Intranet的结合已成为一种典型的计算机模式。TRS
- 李渝勤李琳肖诗斌
- 关键词:数据库连接浏览器阅读器用户界面
- 一种通用HTML网页主题信息提取方法
- Web页面所表达的“主题”信息通常隐藏在大量无关结构和文字中,准确完整地提取网页主题信息是影响Web应用服务质量的关键技术之一。目前的提取方法多依赖于网页模板信息,而Web上的网页模板不计其数,因此这些方法缺乏通用性。且...
- 许文都云程李渝勤施水才
- 关键词:服务质量
- 文献传递
- 面向互联网舆情的热词分析技术被引量:17
- 2011年
- 热词是一种网络词汇现象,反映了某一特定时空范围内人们普遍关注的问题。该文对热词分析的两项关键技术——热词发现和热词关联技术进行了深入的研究。在热词发现阶段,首先采用命名实体识别技术和高频串统计技术进行短语串的挖掘,继而采用基础权值和波动权值两项指标进行热度权值的计算。在热词关联阶段,按热词权值高低进行热词类的划分,通过同现率的原则确定热词类之间的关联计算。该文所采用的方法已经成功应用到TRS舆情监测系统的热点发现模块。
- 李渝勤孙丽华
- 关键词:热词命名实体识别
- 基于规则的自动分类在文本分类中的应用被引量:31
- 2004年
- 文本自动分类是指将文本按一定的策略归于一个或多个类别中的应用技术。本文首先介绍三种基于统计的自动分类技术 (k近邻分类器、支持向量机分类器和朴素贝叶斯分类器 ) ,剖析了基于统计的自动分类的优势及不足。基于统计的自动分类的不足主要表现为 :当类别之间分类特征的交叉变大时 ,分类精度呈下降趋势 ,在多层分类的情况下 ,此局限尤为突出。针对此局限性 ,为了提高自动分类的精度 ,我们引入了基于规则的自动分类来对其进行改进和扩充 ,并整合两种自动分类技术的优点 ,设计出了混合分类器系统 。
- 李渝勤孙丽华
- 关键词:计算机应用中文信息处理文本挖掘文本分类
- 基于分类的图像检索研究
- 针对目前的基于内容的图像检索系统的速度和效率问题,本文提出基于分类技术的图像检索方法。本文首先介绍了基于SVM的多类图像分类的研究,然后介绍了在分类基础之上,构建的基于内容的图像检索系统的原理,最后做出评价。
- 李渝勤钟玲王昕王陈飞
- 关键词:图像分类图像检索支持向量机
- 文献传递
- 句子重述技术在中文文本摘要中的应用被引量:3
- 2008年
- 本文提出了一种对中文文本摘要中抽取出的句子进行重述的方法。首先使用基于统计的方法对文本进行特征统计,计算词和句子的权重,摘取出权值较高的句子;然后对这些句子应用一种基于向量相似度计算的算法进行指代消解,同时提出一种新的句子向量相似度的计算方法去除冗余;最后利用启发式规则进行加工,从而得到文本摘要。实验结果显示,系统修改后的文摘具有较好的连贯性和流畅性,与修改之前的文摘相比,文摘质量有明显提高。
- 周强施水才李渝勤吕学强
- 关键词:相似度信息处理指代消解
- 面向企业的信息网系统
- 1998年
- 信息是管理企业发展的命脉,在信息技术飞速发展的今天,引入先进的技术手段和方法,利用现代化的工具完善企业的信息管理机制,加大企业管理的技术含量,提高企业竞争能力,已成为各企业领导的共识。一、企业信息网的组织结构 成功的企业需要:高效地管理企业经济运转的内部信息;
- 李渝勤肖诗斌王青
- 关键词:企业管理信息网系统MIS
- 全文增补中
- 面向对象的可重用库管理系统被引量:1
- 1999年
- 研究软件的可重用技术是提高软件生产率、解决软件危机的良好途径。好的重用技术可以带来高可靠。高性能、高质量和高效率的软件新系统。重用是支持软件工程新范型的基础前提。文章介绍了一种支持基于重用的、开放的、不依赖于具体领域的可重用部件管理系统。
- 李渝勤李琳
- 关键词:面向对象软件工程可重用部件库
- 基于WordNet的语义分布词典建设被引量:3
- 2007年
- 提出一种基于WordNet自动构建语义分布词典的方法。在介绍WordNet系统和Semcor语料库的基础上,设计语义分布词典的结构。分析Sense.idx文件和Taglist文件内容,详细描述以它们为基础自动构建语义分布词典的过程。
- 张会平吕学强施水才李渝勤
- 关键词:语言资源WORDNET
- BBS中文新词语自动挖掘被引量:2
- 2007年
- 针对从BBS文本中自动挖掘新词语的问题,提出一种结合统计和规则的简单易行的方法,采用中文分词、频数统计、词性过滤、词语碎片组合等关键技术。据此方法开发的系统可以自动挖掘不限长度、不限领域、不限类别的与上下文无关的任意新词语。
- 吕学强黄河李渝勤施水才
- 关键词:新词语