国家科技支撑计划(2012BAH04F03)
- 作品数:9 被引量:32H指数:4
- 相关作者:吴洁明刘高军周锦李汶羲王帅更多>>
- 相关机构:北方工业大学更多>>
- 发文基金:国家科技支撑计划北京市教委科技发展计划北京市自然科学基金更多>>
- 相关领域:自动化与计算机技术机械工程更多>>
- 基于连通域的扭曲中文文本图像快速校正方法被引量:3
- 2015年
- 针对扭曲中文文本图像文字识别率不理想这一问题,提出一种基于连通域的文本图像快速扭曲校正方法。根据汉字结构特征合并连通域,实现切分文字;利用就近聚合文字的方法定位文本行,按行垂直校正每个文字位置,获得被校正的图像。实验结果表明,该方法校正速度快,对严重扭曲的中文文本图像能取得较好的校正效果,校正后图像的OCR识别率明显提高。
- 曾凡锋郭正东王战东
- 关键词:连通域文字切分
- 改进的互信息量相似度曲线关键帧提取研究被引量:5
- 2014年
- 关键帧提取是基于内容视频检索和比对等工作的关键步骤,它的准确性和效率是后续工作的基础。针对目前关键帧提取存在的阈值选择困难、算法复杂等问题提出改进的互信息量关键帧提取算法,构造基于非均匀分块加权HSV直方图的互信息量相似度曲线检测算法,取相邻两高曲率点的中间帧作为关键帧。实验结果表明,该算法无需阈值选择,能实现关键帧自动提取并且只需要一次扫描就能快速得到准确的关键帧。
- 刘高军杨丽
- 关键词:关键帧互信息量
- 基于DCI的数字作品版权保护研究和设计被引量:5
- 2015年
- 互联网的发展使数字作品版权保护面临着历史性的挑战,解决互联网版权问题对于版权产业的发展起着决定性作用。为了有效地保护数字网络环境下的作品版权,对版权保护方案进行设计。通过数字作品版权登记平台为每个数字作品赋予DCI,对数字作品的版权进行标识,通过特定的水印检测算法提取出数字作品中的DCI码,获取作品的权利信息,从而确认数字作品的版权真伪,为实现数字作品版权的检测、跟踪、取证及证据保全等管理工作奠定基础。
- 吴洁明王帅
- 关键词:版权保护
- “嵌入式”版权服务组件管理平台设计与实现被引量:1
- 2016年
- 综合国内版权服务的研究现状,针对如何对接现有内容系统进行数字作品版权登记的问题,提出了构建"嵌入式"版权服务组件管理平台的新思路,论述了组件管理平台的产生背景、设计思路及实现细节,详细描述了平台的核心业务流程.根据设计完成了平台的开发,并将其实际运用到中国版权保护中心的数字作品版权登记业务中.
- 刘高军周全
- 关键词:管理平台
- 基于Heritrix的网络爬虫研究与应用被引量:4
- 2013年
- 主要介绍了主题搜索引擎、网络爬虫的基本概念和Heritrix系统的体系结构,分析了Heritrix的工作流程,在Heritrix框架的基础上进行扩展和优化。通过一个实例,实现了对京东网图书信息的抓取,为建立面向图书信息的垂直搜索引擎提供了网页信息资源。
- 刘高军夏景隆
- 关键词:网络爬虫主题搜索引擎HERITRIX
- 基于Mahout的图书推荐引擎的研究与设计被引量:5
- 2015年
- 推荐引擎是一种根据用户的兴趣特点和操作行为做出预测,向用户推荐用户感兴趣的信息或商品的应用引擎。本文分析了现有的主流技术和Mahout协同过滤算法,提出推荐逻辑的改进和排名的优化。还采用分布式存储和并行计算等技术,分析并设计了一个针对电子商务网站中海量的图书的推荐引擎,为用户提供针对电子商务网站中图书的快速、准确的推荐服务。
- 吴洁明李汶羲
- 关键词:协同过滤推荐引擎分布式
- 基于Oracle数据库SQL查询语句优化规则的研究被引量:8
- 2013年
- 通过对Oracle数据库中SQL查询语句的执行原理和过程进行研究,以现有系统书号实名申领信息系统中的数据库为例,对执行的SQL查询语句的执行计划进行了分析,从SQL语句执行过程涉及到的系统资源和执行方式入手,对SQL查询语句进行优化,最后得出一系列的优化规则,并根据优化结果对这些规则进行验证。
- 吴洁明周锦
- 关键词:数据库性能
- 面向视频场景内容检索的文本解析工具设计与实现被引量:1
- 2012年
- 在足球赛事视频的应用背景下,分析了面向视频场景内容检索的文本解析关键技术,设计并实现了面向视频场景内容检索的文本解析工具。该工具利用中文分词技术分割自然语言文本,通过汉语语法规则提取关键词,采用加权算法对关键词排序,并将关键词映射到知识表达集,从而获得关键词的语义信息,完成文本解析。实验结果表明,该工具能够满足自然语言文本的视频检索需求。
- 吴洁明周正喜史建宜
- 关键词:文本解析关键词提取知识表达
- 基于CNONIX的XML与EXCEL相互转换技术研究
- 2015年
- 针对CNONIX标准的特点,提出了一种符合CNONIX标准的XML与EXCEL相互转换的技术方案,解决了CNONIX标准XML格式与EXCEL格式数据无法自动转换的问题。该方案首先将分析CNONIX标准数据元结构,根据CNONIX数据元结构生成XML格式模板和存储CNONIX中英文对照表文件;然后根据中英文对照表将XML格式数据转换成EXCEL数据格式;最后根据CNONIX的XML模板将EXCEL转化成XML数据格式文件。经过对CNONIX标准的XML格式与EXCEL格式文件进行转换测试,实验结果表明该技术方案能将CNONIX的XML格式数据与EXCEL格式数据准确地进行相互转换。
- 刘高军李丹程利伟钱程段然