张延堂 作品数:4 被引量:8 H指数:2 供职机构: 兰州大学 更多>> 发文基金: 国家科技基础性工作专项 更多>> 相关领域: 自动化与计算机技术 自然科学总论 更多>>
一种基于关键重复语义的最大熵文本分类 被引量:2 2007年 文本分类做为Web文本挖掘的重要手段和搜索引擎的重要组成部分而被广泛研究。现有的分类系统大都依赖于中文分词,尽管达到分类目的,但随着Web文档数量的增加和网络新词汇的不断出现,面临着特征维数急遽增高带来的时空开销问题,严重影响了系统的性能。在此抛开中文分词而尝试使用基于关键子串的特征提取并结合最大熵模型给出了一种分类系统的实现。实验表明,与现有的分类系统相比,具有较好的问题求解效率和适应性。 屈志毅 李一伟 张延堂 杨曙光 张菲菲关键词:文本挖掘 文本分类 最大熵模型 特征提取 基于Spring框架的ETL工具的研究与实现 ETL(Extraction-Transformation-Loading)是从多个业务数据源中抽取数据,并依据业务需求对数据进行清洗、转换,最终载入目标数据仓库的过程。是数据仓库构建的主要过程。本文研究了ETL过程的关... 张延堂关键词:数据源 数据仓库 元数据模型 J2EE框架 文献传递 一种金融系统专用ETL工具的研究与实现 被引量:3 2008年 实现了一种基于Spring框架的商业银行专用ETL程序。该程序利用Spring框架的控制反转技术,基于Ibatis的数据访问对象技术和Spring JDBC,以及Spring对Timer的支持,解决了ETL过程中的数据转换、数据载入、生命周期管理、任务调度等关键问题。该程序在IBM System x3850(8864I02)上运行,载入数据的平均速度达到每秒900条记录。 屈志毅 张延堂 王戈关键词:ETL工具 SPRING框架 数据转换 任务调度 基于本体的强对流天气查询系统 被引量:3 2008年 在研究强对流领域信息查询的基础上,提出一个原型系统ontoWeather。该系统建立了气象强对流领域本体库,并构造强对流领域的推理规则。运用Jena实现该领域基于语义的检索功能,得出潜在的语义查询结果,为气象领域提高信息检索的查准率和查全率提供一个有效方法。 屈志毅 张菲菲 李一伟 张延堂关键词:本体 语义检索 强对流