瞿有利
- 作品数:42 被引量:179H指数:7
- 供职机构:北京交通大学计算机与信息技术学院更多>>
- 发文基金:国家自然科学基金中央高校基本科研业务费专项资金教育部科学技术研究重点项目更多>>
- 相关领域:自动化与计算机技术理学电子电信更多>>
- 基于知网和话题更新的话题跟踪算法研究
- 话题跟踪是一项面向新闻报道信息流进行已知话题跟踪的信息处理技术,它通过训练得到的话题模型,识别出后续报道中与已知话题有关的报道,属于话题检测与跟踪的一项子任务。本文在现有的向量空间描述文档的基础上,实现了一个基于话题更新...
- 焦健瞿有利
- 关键词:自然语言处理新闻报道知网
- 通用Web多级汇总型报表工具的设计
- 2006年
- 基于B/S的Web多级汇总报表工具,由基础及汇总模板、报表模板设计器组成,并根据下发的基层部门和时间生成所需报表。基于Web应用程序,用户通过浏览器,直接或通过语义层使用数据源,完成各种报表的设计,生成报表模板及数据自动汇总。该模板设计器主要负责界面的设计和与用户的交互,实现动态数据绑定,并把模板的信息保存。
- 李林利王义新瞿有利
- 基于HS-树的所有MIPS求解算法
- 2009年
- 本体在语义web中扮演很重要的角色.本体的重用、合并或者进一步扩展都有可能导致本体不一致.目前很多解决本体不一致的方法都需要计算最小不一致保持子集(MIPS).本文利用HS-树方法给出了一种能够有效计算本体中所有MIPS的算法.实验表明该算法是有效的,尤其对于本体中包含不可满足的概念远远多于MIPS的情形更加有效.
- 周丽平黄厚宽瞿有利漆桂林季秋
- 关键词:语义WEBMIPS本体
- 周期分类和Single-Pass聚类相结合的话题识别与跟踪方法被引量:28
- 2009年
- 针对增量式聚类初始时话题模型不够充分和准确,随处理报道数量增加,误检与漏检的累积效应被放大的问题,提出了周期分类和Single-Pass聚类相结合的话题识别与跟踪方法.首先采用增量式聚类算法进行话题识别与跟踪,当新闻文本每积累到一定程度之后,对已经聚类的报道进行周期分类,使话题簇精度提高,从而提高后续话题识别与跟踪精度.实验表明这种方法是有效的,能够降低漏检率与错检率,减少归一化错误识别代价.
- 税仪冬瞿有利黄厚宽
- 关键词:话题识别与跟踪增量聚类文本分类
- 一种基于噪音过滤包装器的Web新闻抽取方法
- 2017年
- 从海量Web新闻网页中抽取高纯度新闻,并以结构化的形式存储,是舆情监测、话题更新等研究的基础。本文提出一种基于噪音过滤包装器的方法抽取Web新闻,归纳包装器时,若2页面字符串对比失配,计算其字符串标签路径比,根据阈值α,标记不同符号区分新闻内容和噪音。同时提出了朴素贝叶斯Web新闻标题分类器和时间分类器抽取新闻题目和时间。实验结果表明,本文方法与其他抽取技术相比准确率和鲁棒性有显著的提高,具有重要的实际应用价值。
- 孙梦瞿有利
- 关键词:信息抽取包装器新闻网页朴素贝叶斯分类器
- 基于CRF的分区倒排索引压缩算法
- 2024年
- 倒排索引是大型搜索引擎的核心数据结构,本质是倒排列表中整数序列的集合。倒排索引压缩可以有效减少倒排索引所占空间,提高对关键词的检索效率。本文提出的基于条件随机场(CRF)的分区倒排索引压缩算法主要关注域值分区的分区方式。该算法对序列进行预分区,并且使用条件随机场对预分区进行标注并重组,有效减少了压缩时间。根据分区类型,该算法使用相应的编码方式,进一步减少了压缩后的空间占用。与其他倒排索引压缩算法进行对比实验分析,结果表明本文算法在压缩率上超过目前一些域值分区的算法,并且在解压时间上与其他域值分区算法相当。该算法在时间和空间上取得了较好的平衡。
- 王子琛瞿有利
- 关键词:倒排索引数据压缩条件随机场搜索引擎
- 非线性多环管路网络系统的链路遗传求解被引量:1
- 2001年
- 通过对一组规模随网络环路规模呈指数增长的非线性方程组的求解 ,实现对非线性多环管路网络系统的仿真、评估和优化 .以模式理论为基础 ,使用遗传算法求解非线性方程与方程组 ,可利用其呈指数增长的求解能力进行求解 .能够在一阶空间和时间复杂度内求解方程组的数值解 ,同时能够在可行的时间内解决网络结构优化问题 .求解过程和结果能够验证模式理论的正确性 .
- 刘来旸樊孝忠刘宇瞿有利
- 关键词:管路网络遗传算法
- B/S模式应用系统的一种新型结构及其实现被引量:41
- 2000年
- 由于目前B/S模式应用系统的缺陷,提出了一种新型的系统结构并从原理上阐述了它的合理性,最后从模块间的通信、处理线程和数据库操作线程间的同步和互斥以及系统安全等方面讲述系统的实现。
- 瞿有利瞿宏阳
- 关键词:B/S模式系统结构应用系统INTERNET网
- 科技项目评审专家分组匹配算法被引量:7
- 2014年
- 为了解决科技项目评审中申请书与专家的分组匹配问题,提出了一个基于二部图谱划分异构对象分组匹配算法.该算法用二部图描述申请书与专家之间的对应关系,提出了关联强度计算公式,计算图中每条边的权重值,求出图的关联矩阵,对关联矩阵进行奇异值分解得到奇异特征向量,用k-means分组算法对奇异特征向量进行分组.利用申请书与专家分组匹配算法能够实现项目评审过程中申请书与专家的自动分组与匹配,并且分组匹配结果有较高的准确性和合理性.
- 毛晚堆谷千军褚蓓蓓瞿有利
- 关键词:二部图图切分谱聚类
- 网络通讯程序自动生成器的设计与实现
- 在网络环境下开发程序,几乎所有的程序开发者都遇到过字节序转换、数据传输等重复开发问题。
本文介绍的网络通讯程序自动生成器很好地解决了这些问题,并给出了多网卡和粘包问题的解决方法。
- 刘兰辉瞿有利黄厚宽
- 关键词:自动生成器多网卡网络通讯程序
- 文献传递