牛军钰 作品数:30 被引量:183 H指数:7 供职机构: 复旦大学 更多>> 发文基金: 国家自然科学基金 国家高技术研究发展计划 “九五”国家科技攻关计划 更多>> 相关领域: 自动化与计算机技术 文化科学 政治法律 经济管理 更多>>
基于条件互信息的特征选择改进算法 被引量:9 2012年 针对传统特征选择算法只专注于特征类相关性或者特征冗余性的问题,提出一种基于条件互信息的特征选择算法。该算法采用k-means的基本思想聚类特征,并从中选出类相关度最大的特征,从而去除不相关和冗余特征。实验使用5个数据集,结果表明,该算法的分类性能优于传统特征选择算法。 刘海燕 王超 牛军钰关键词:数据挖掘 互信息 条件互信息 聚类 政府绩效考核公众测评的信息化探索 2014年 科技进步使得信息化技术突飞猛进,全球信息化成为大势所趋。同时,在政府绩效考核中公众参与测评越来越被人们重视,为广泛全面的开展公众测评,需要引入信息化的技术。构建了政府绩效考核公众测评信息化系统,将信息化手段应用到政府绩效考核的公众参与测评过程,提高公众测评效率,保证考核的公开公正公平,是完政府善绩效考核体系的有益探索。 周璐 牛军钰关键词:绩效考核 信息化 论坛社区用户时空特征建模与挖掘 用户建模是提供个性化服务的基础工作.结合数据挖掘在论坛社区系统中的运用,把言论行为建模为数据记录,提出基于时空特征属性的用户模型(spatiotemporal feature based user model)表示和挖掘... 郑佳谦 徐隽 姚静 牛军钰关键词:用户建模 文献传递 基于倒排文件的索引模型综述 1引言文本索引中一般存放着文本库词典,记录着相应索引项的出现位置及其一些统计信息。经典的索引模型包括倒排文件,签名文件,位图,PatriciaTrie等。文[9]中考察了倒排文件与签名文件在索引文本数据方面的性能,结果表... 孙琦 牛军钰关键词:INDEX 文献传递 区域一体化高质量发展绩效评价研究——以长三角一体化高质量发展绩效评价为例 被引量:1 2022年 建立科学合理的评价指标体系是推动区域一体化发展战略、提升区域各方面绩效、提高整体发展水平的关键举措。本研究基于运用导向性、系统性、可操作性、可比性等四大原则,建立了"决策—执行—满意度"三维立体构成的绩效分析理论框架,构筑起全面、科学的"区域发展绩效评价指标体系",并以长三角地区为分析案例,从战略决策、高质量、一体化、满意度四个方面对长三角一体化高质量发展的绩效进行评价。通过对上述指标体系的运用和模拟评价,本文分析了长三角一体化发展现状和问题,并从定量和定性角度提出了有针对性的发展优化建议。 牛军钰 朱元婷 郑巧菲 高小平关键词:长三角 一体化 绩效评价 基于多角度关联模型的实体检索方法 被引量:1 2013年 针对信息检索领域特定类型实体的检索问题,在传统搜索引擎的基础上,提出一种基于多角度关联模型的实体检索方法,综合运用实体名识别(NER)、文本向量、关联规则等技术以及Wikipedia、Stanford NER等工具,并在TREC2010实体检索项目中进行评测。实验结果表明,与基于BM25和贝叶斯模型的检索方法相比,该方法的nDCG@R值平均提高11.49%和18.09%。 王东 牛军钰关键词:文本挖掘 关联规则 实体名识别 维基百科 搜索引擎 开放集成的工作流管理系统模型 被引量:11 1999年 1 引言工作流管理是近年来在计算机应用领域中发展最为迅速的几项新技术之一,已经广泛地应用于办公自动化、CAD、文件管理、电子邮件、目录管理、群件应用、BPR(Business Process Reengineering)及结构系统定义工具等领域,大量的研究及开发工作也正在蓬勃开展。随着计算机软件技术和通信网络技术的高速发展及源于不同应用领域中信息量的迅速膨胀,使用户对计算机应用的需求发生了极大的变化,应用计算机环境已从集中式发展到分布式。为群体工作成员提供支持协同工作的公共环境。 牛军钰 赵大哲 赵宏关键词:工作流管理系统 计算机应用 基于DOP技术的目标语生成机制 2001年 提出在面向数据的英汉机译系统中 ,一种以面向数据的语言分析技术作为基本框架的目标语生成机制 .该机制通过对源语语句的句法分析树进行线性化操作 ,生成目标语译文 .其中包括从源语语句句法分析树的所有片段组合形式中选择一个适合生成操作的生成片段组合形式、对生成片段组合形式中的所有片段进行线性化操作以及对所有片段已经线性化的生成片段组合形式进行线性化操作 ,从而获取最终的目标语译文 .为论证方法有效性 ,基于包含 1,0 0 0个语句的真实英语语料构建知识源 ,并采用包含 10 0个语句的真实英语语料作为测试集 .实验表明 ,目标语译文质量比较令人满意 。 张杰 牛军钰 孙晓光关键词:机器翻译 DOP 自然语言处理 链接信息在Web检索中的应用 被引量:5 2002年 介绍了在Web检索中的应用链接信息的PageRank算法、Kleinberg算法、超链接相似度函数、SALSA算法,并给出了实验数据。 万华 牛军钰 吴立德关键词:链接信息 WEB 互联网 信息检索 PAGERANK算法 一种基于时间流特性的垃圾邮件过滤方法 被引量:1 2009年 垃圾邮件过滤具有处理规模巨大,数据无限递增、动态变化等流数据特征,传统的垃圾邮件过滤方法利用静态的文本特征提取方法,无法体现流数据特征随时间动态变化的特点。该文提出一种基于时间流特性来实时调整有效特征的垃圾邮件过滤方法,在TREC Spam Track语料集上的测试结果表明,该方法在保证垃圾邮件过滤高准确率的同时,使垃圾邮件过滤计算的时间性能和空间性能更加优化。 徐隽 郑佳谦 姚静 牛军钰关键词:计算机应用 中文信息处理 垃圾邮件 流数据 文本分类