您的位置: 专家智库 > >

曹玉娟

作品数:8 被引量:33H指数:4
供职机构:北京航天飞行控制中心更多>>
发文基金:国家自然科学基金教育部“新世纪优秀人才支持计划”更多>>
相关领域:自动化与计算机技术航空宇航科学技术理学文化科学更多>>

文献类型

  • 4篇期刊文章
  • 2篇会议论文
  • 1篇学位论文
  • 1篇专利

领域

  • 3篇自动化与计算...
  • 2篇航空宇航科学...
  • 1篇文化科学
  • 1篇理学

主题

  • 4篇网页
  • 4篇近似网页
  • 3篇去重
  • 3篇去重算法
  • 3篇网页去重
  • 3篇网页去重算法
  • 3篇小世界
  • 2篇支持向量
  • 2篇支持向量机
  • 2篇特征向量
  • 2篇网络
  • 2篇向量
  • 2篇向量机
  • 2篇小世界网络
  • 1篇倒排索引
  • 1篇信息检索
  • 1篇蚁群
  • 1篇蚁群算法
  • 1篇有限混合模型
  • 1篇语义

机构

  • 6篇北京理工大学
  • 5篇北京航天飞行...

作者

  • 8篇曹玉娟
  • 4篇牛振东
  • 3篇赵堃
  • 2篇彭学平
  • 2篇江鹏
  • 2篇赵育民
  • 1篇师明
  • 1篇王保丰
  • 1篇高宇辉
  • 1篇陈骁
  • 1篇王维强

传媒

  • 1篇软件学报
  • 1篇航天器工程
  • 1篇中南大学学报...
  • 1篇中国索引
  • 1篇中国宇航学会...

年份

  • 1篇2018
  • 1篇2011
  • 3篇2010
  • 1篇2009
  • 1篇2008
  • 1篇2007
8 条 记 录,以下是 1-8
排序方式:
一个基于特征向量的近似网页去重算法被引量:6
2009年
在搜索引擎的检索结果页面中,用户经常会得到内容相似的重复页面,它们中大多是由于网站之间转载造成的。为提高检索效率和用户满意度,提出一种基于特征向量的大规模中文近似网页检测算法DDW(Detect near—Duplicate Web Pages)。试验证明,比起其他网页去重算法(I—Match),DDW具有很好的抵抗噪声的能力及近似线性的时间和空间复杂度,在大规模实验中获得良好测试结果。
曹玉娟牛振东彭学平江鹏
关键词:网页去重算法特征向量近似网页支持向量机
基于蚁群算法的飞船返回舱搜救最优路径选择算法
针对传统路由选择算法求解'飞船返回舱搜索救援最佳路径选择'收敛速度慢,传统蚁群算法计算量大、参数多的问题,利用蚁群能够发现从巢穴到食物源之间较短路径的特性,提出了一种可快速求解最优路径的自适应动态路由(ADR)搜索算法。...
曹玉娟陈骁
关键词:飞船返回舱蚁群算法
文献传递
一个基于特征向量的近似网页去重算法
在搜索引擎的检索结果页面中,用户经常会得到内容相似的重复页面,它们中大多是由于网站之间转载造成的。为提高检索效率和用户满意度,提出一种基于特征向量的大规模中文近似网页检测算法DDW(Detect near-Duplica...
曹玉娟牛振东彭学平江鹏
关键词:网页去重算法特征向量近似网页支持向量机
文献传递
基于概念和语义网络的近似网页检测算法被引量:15
2011年
在搜索引擎的检索结果页面中,用户经常会得到内容近似的网页.为了提高检索整体性能和用户满意度,提出了一种基于概念和语义网络的近似网页检测算法DWDCS(near-duplicate webpages detection based on concept and semantic network).改进了经典基于小世界理论提取文档关键词的算法.首先对文档概念进行抽取和归并,不但解决了"表达差异"问题,而且有效降低了语义网络的复杂度;从网络结构的几何特征对其进行分析,同时利用网页的语法和结构信息构建特征向量进行文档相似度的计算,由于无须使用语料库,使得算法天生具有领域无关的优点.实验结果表明,与经典的网页去重算法(I-Match)和单纯依赖词汇共现小世界模型的算法相比,DWDCS具有很好的抵抗噪声的能力,在大规模实验中获得了准确率>90%和召回率>85%的良好测试结果.良好的时空间复杂度及算法性能不依赖于语料库的优点,使其在大规模网页去重实际应用中获得了良好的效果.
曹玉娟牛振东赵堃彭学平
关键词:网页去重算法小世界网络近似网页均方差
面向航天器飞控任务的大数据处理系统的设计与验证被引量:8
2018年
针对传统数据组织管理方式难以满足后续大数据处理要求的问题,提出一种面向海量任务数据处理的通用型技术架构,围绕任务系统实际需求开展数据采集、数据预处理、数据存储、数据查询和数据挖掘等关键技术研究,并以开源组件、中间件和第三方组件的方式实现原型系统。分别构建单目标多测站、多目标多测站等任务场景,对系统数据采集效率、入库效率、查询能力进行用例测试验证,指标均优于传统任务系统,且满足任务使用需求;使用天宫一号数据对系统数据挖掘功能进行决策树和回归分析验证,系统目标评估指标的准确率、覆盖率都达到了100%。研究结果可为面向航天工程任务数据的组织管理、知识挖掘以及智能决策等问题提供参考。
师明王保丰曹玉娟高宇辉
关键词:航天工程大数据分布式存储
基于概念和小世界模型的WEB信息检索关键技术研究
曹玉娟
关键词:WEB信息检索小世界网络关键词自动抽取扩展查询正文提取
基于ARMA-TS-GARCH有限混合模型的交通数据分析被引量:4
2010年
基于对时间序列数据进行研究时不仅需要对它们的自回归性和周期性进行分析,而且需要对序列的方差与长期性无规则波动进行分析等问题,提出基于ARMA模型和APARCH模型的ARMA-TS-GARCH模型,并且对该模型的构造进行分析,针对洛杉矶长滩地区交通量数据进行模型参数估计和诊断检验,将此模型与GARCH和ARMA-GARCH模型进行比较。研究结果表明:ARMA-TS-GARCH模型对数据的拟合要优于ARMA模型和APARCH模型;用ARMA-TS-GARCH模型对数据集进行预测,所得结果较理想。
王维强牛振东曹玉娟赵育民赵堃
关键词:时间序列
一种基于小世界特性的中文近似网页去重方法
本发明为解决内容近似中文网页的自动检测问题,公开了一种基于小世界特性的中文近似网页去重方法。该方法兼顾考虑网页的语法和语义信息,首先根据提取出的网页有效信息构建文本词汇共现图。然后,基于文本的小世界特性提取出文档特征向量...
曹玉娟牛振东赵堃赵育民江鹏
文献传递
共1页<1>
聚类工具0