陈金鑫
- 作品数:5 被引量:5H指数:2
- 供职机构:南京师范大学更多>>
- 相关领域:自动化与计算机技术文化科学更多>>
- 一种发现多记录Web文档记录分隔符的方法
- 2008年
- 从半结构化或者非结构化的Web文档中提取信息时通常要求指定记录集的边界符。如果不根据记录边界符将包含多记录的页面分成单个记录块,那么记录的提取就不能成功。本文主要介绍了一种根据启发式的规则发现Web文档中的记录分隔符的方法,能够很好地解决多记录页面记录分割的问题。实验证明该方法具有很高的准确性。
- 胡大洋陈金鑫
- 关键词:信息提取半结构化信息非结构化信息
- 基于WEB的书目信息自动搜集与服务
- 电子书目数据/(又称书目数据信息/)指的是以数字化形式存在的有关图书资料的元数据,它的建设是数字图书馆资源建设中一个重要的组成部分。传统上,书目信息的建设需要人工逐条录入,这不但需要繁重的人力劳动,还给书目信息的准确性和...
- 陈金鑫
- 关键词:数字图书馆MARC主题爬虫信息抽取
- 文献传递
- 基础教育黄页网站自动生成系统的设计与实现被引量:2
- 2007年
- 为了较好地解决基础教育用户搜索教育资源难、不能直接链入基础教育网站等问题,主要研究解决基础教育资源及网站的自动发现和分类等核心技术。提出发现Deep Web的启发式规则及多重特征选择方法。通过该系统将实现基础教育相关资源及网站的自动发现与分类,并以多种分类方式供教育用户检索。
- 罗立群张慰陈金鑫
- 关键词:自动生成系统垂直搜索DEEPWEB
- 基于主体知识库的Web主体信息抽取系统
- 2007年
- 针对Web信息主体的多元化和Web表现形式的异构化,开发了一种基于主体知识库的Web信息提取系统,通过主体的知识库来识别要提取内容的位置,从而能够有效提取出用户所关注的主体的属性信息。实验表明,该系统具有很好的通用性,能够较好地完成对半结构化Web信息主体的提取工作。
- 陈金鑫罗立群
- 关键词:信息主体信息抽取
- 视觉文化研究与教育资源开发创新被引量:2
- 2007年
- 视觉文化研究作为教育资源创新过程中的媒介,可以让更多的视觉教育资源脱颖而出,起到有效的教育教学作用。视觉文化研究开拓了教育技术的新视野,也要求教育技术人要把真正适合于教育、学习的资源进行有效开发与利用,把视觉文化的研究融入进去,走出一条适合我们本土教育模式的道路,开发出适合本土教育的视觉教育资源。
- 申灵灵罗立群陈金鑫
- 关键词:视觉文化教育资源教育技术