- 第三代图书馆服务平台的元数据管理——以FOLIO的Codex方案为例被引量:48
- 2020年
- 在数据化的网络时代,用户需求与图书馆服务形式向深度专业的知识化和智慧化发展。面对这种新常态,第三代图书馆服务平台的元数据管理不仅需要解决图书馆集成管理系统甚或是"下一代"图书馆服务平台受困于MARC的现状,满足资源的统一管理与业务整合,更需要考虑统一的数据建模与编码方式,实现跨类型的数据流通和知识的组织与融合。这就为元数据管理提出了新的需求,包括:完整的生命周期管理,资源类型兼容,标准规范兼容,互联网环境下的书目与规范控制,知识组织与融合。这种运用平台化思维、改变图书馆运行生态的可能性可以在FOLIO项目中看到希望。FOLIO作为以微服务架构设计的图书馆服务平台,在设计之初就定义了一个核心的微服务域--Codex。一方面,Codex作为数据注册中心和数据链接中介位于FOLIO架构的顶层,通过Codex消除不同域中数据的编码、格式和存储位置的差异,以减少域之间的交互与耦合。另一方面,Codex以BIBFRAME 2模型为基础设计了"作品-实例-单件/馆藏"的抽象数据模型,并参考DC元素设计了一套最小核心元数据元素集。Codex记录不描述资源的详细信息,只起到揭示与定位的作用。专有的业务信息或更详细的记录信息都可以通过Codex链接到相应的记录层获取。Codex作为核心的元数据管理域,将被设计成为FOLIO平台的资源链接中心、规范数据中心、跨域的全媒体资源管理入口,并通过模型中的抽象实体揭示资源间的关系。虽然现阶段仅实现了不存储自身数据的Codex Search,对关联数据的支持也不够完善,但无论是其抽象的数据模型,还是最小化的元数据方案,以及"统一记录-业务记录-正式记录"的分层描述原则,Codex都有足够的灵活性支持面向实体对象的描述与组织。
- 许磊夏翠娟
- 关键词:元数据管理FOLIO
- CNMARC与BIBFRAME映射及其实现--以上海联编中文普通图书数据为例
- 2017年,上图开始探索关联书目数据的发布,计划分阶段实施,第一阶段目标是发布上海联编部分普通中文图书类数据。基于数字人文项目的本体模型应用经验,书目数据本体拟使用书目框架(BIBFRAME),其中CNMARC字段与BI...
- 许磊
- 关键词:CNMARC字段映射关系
- 图书馆联盟的开源LSP探索与实践:以FOLIO与云瀚平台为例
- 2024年
- 随着图书馆联盟智慧化转型的深入,开源图书馆服务平台(LSP)为其提供了自主可控的技术方案。本文以FOLIO和云瀚平台为例,采用案例研究方法,探讨开源LSP在图书馆联盟中的应用实践。FOLIO平台目前多为单租户部署,随着MOBIUS等图书馆联盟的加入,ECS和Open RS方案为其多租户联盟应用提供了实施路径。上海市中心图书馆部署的云瀚平台,通过单租户模式为成员馆提供统一的书目数据和流通服务,确保“一卡通”通借通还服务的延续性。同时,云瀚社区开发了分馆支撑模块,满足分馆基本的馆藏管理与加工需求。得益于云瀚平台“平台+应用”的模式,上海市中心图书馆各分馆可按需灵活部署功能模块,并且通过对接三大底座,消除自治孤岛,构建起联盟内跨类型、跨区域统一的资源管理和服务平台。这为克服图书馆联盟的同质化和内卷技术、业务、数据化问题提供了可供参考的技术实践。
- 吴凌芸许磊
- 关键词:图书馆联盟
- CNMARC数据中作品的识别与建模被引量:2
- 2022年
- 作品识别是书目数据重构的关键的一步,并决定了所有的后续操作。书目世界的作品概念继承自潘尼兹,经过柳别斯基等人的阐述,最终确定了书目数据作品与载体的二分法。可操作性的作品识别可以在具现化的文本层面实现。指称作品的题名、所有署名的责任者,以及基于用户研究确认的语种共同构成识别作品的基本元素。同时,在作品模型中引入顶层的抽象实体——超级作品,实现对相关作品的聚合,并最终形成作品家族。随后,根据语种、汇编类型对CNMARC数据进行分包,由简入难,依次对每类数据制定相应的作品识别方案。并以非翻译类单语种文献、翻译作品和丛编作品为例对CNMARC数据中作品的识别与建模进行说明。
- 许磊
- 关键词:CNMARC关联数据
- 基于FOLIO平台的图书馆馆藏资源管理
- 2024年
- “十四五”以来,智慧图书馆建设逐渐进入高质量建设深水区。新一代图书馆服务平台是智慧图书馆建设的重要抓手。上海图书馆云瀚平台是FOLIO的中国化。云瀚以“平台+应用”的模式为系统开发提供了足够的灵活性和可扩展性。FOLIO馆藏管理系统就是云瀚平台的首个应用模块。上海图书馆在前期用户需求调研基础上,利用云瀚平台的业务和技术底座,并复用FOLIO社区的LSP基座模块,扩展开发了3个基础App(详编、简编、数据导入)和5个业务App(验收、出入库、移库、清点、剔旧),初步实现了上海图书馆纸质馆藏资源的全流程管理。
- 许磊
- 关键词:FOLIO图书馆服务平台
- 关联数据URI设计规范探讨被引量:14
- 2016年
- 统一资源标识符(URI)是互联网领域重要的基础技术之一,是在网络虚拟空间标识和定位事物的基本方式。作为统一资源定位符(URL)的上位概念,URI在形式和功能上规范了互联网资源标识体系,为基于概念和模拟真实世界的关联数据应用提供了基本的标识和解析技术。当前业界关联数据应用正处于起步阶段,亟需引介推广重要的技术规范并交流相关实践。本文遵照万维网协会(W3C)有关URI设计原则的推荐规范,从URI的类型、设计原则和模式等三个方面介绍国外关联数据URI设计的最佳实践。最后结合上海图书馆的实践,设计关联数据应用的URI应用规范,以供同行参考。
- 许磊夏翠娟刘炜张磊
- 关键词:关联数据
- CNMARC与BIBFRAME的映射基础及其实现被引量:9
- 2018年
- 关联数据已经成为图书馆资源开放的重要技术手段。书目数据作为图书馆最核心的数据资源,在网络中开放共享是必然趋势。关联书目数据发布的关键一步是MARC字段与本体词表之间的映射。本文在梳理元数据映射、元数据元素与知识本体之间的关系基础上,对CNMARC字段与BIBFRAME本体词表的语义映射关系进行总结,并以典型的字段映射进行说明。
- 许磊
- 关键词:CNMARC
- 基于实体—关系模型的档案类资源本体构建研究——以复旦大学图书馆藏当代中国社会生活资料为例被引量:4
- 2021年
- 档案类资源因多以汇集资料形式存在,且文件之间存在层级结构关系,故难以采用图书馆和博物馆对资源的描述方式。本文以复旦大学馆藏当代中国社会生活资料为例,通过对档案领域本体OAD和EAC-CPF的研究,并对BIBFRAME2.0模型适用档案类资源的可行性进行分析,最终选择以BIBFRAME2.0为基础,引入OAD本体中的部分语义词构建适合档案类资源多层级结构描述的本体模型,为以关联数据方式整合馆藏资源奠定基础。
- 苗青许磊薛崧
- 关键词:档案本体关联数据
- 中文关联书目数据发布方案研究被引量:17
- 2018年
- 本文在对国际关联书目数据调研的基础上,论述图书馆将MARC数据发布为关联书目数据的意义,并以上海市文献联合编目中心的中文书目数据为例,探讨关联书目数据发布中的数据建模、本体词表设计、CNMARC与关联书目数据模型的映射设计、中文关联书目数据发布中的内容整合方案和技术实现方案,最后总结现存问题和不足之处。
- 夏翠娟许磊
- 关键词:CNMARC
- 图书馆系统演变及其元数据管理被引量:11
- 2021年
- 图书馆系统自1950年代起步,由最初的单模块系统逐渐发展到整合采编典流等多个模块,并以MARC格式为轴的第一代集成系统。随着信息生态的变化,无论是封闭的MARC格式还是系统的堆叠式开发,都使其丧失了“集成性”。鉴于此,新一代图书馆系统,即图书馆服务平台通过设计统一的数据模型与集中式元数据仓储,实现了对全媒体资源和多种元数据标准的兼容,初步实现纸电一体化。相较于商业化的Alma,开源的FOLIO平台为图书馆提供了一个更加自主的平台。在元数据管理方面,FOLIO设计了“统一记录—业务记录—正式记录”的分层描述原则,构建从抽象层到详细描述层的链路。顶层的统一记录即Codex是整个平台的数据注册与链接中心,制定了兼容多种媒体资源的数据模型与最小元素集,消除了描述标准、数据格式和存储位置的差异。FOLIO也为知识融合和实体管理提供了实施基础与方案。一方面以BIBFRAME 2.0和DC为基础的Co⁃dex,为面向实体的元数据管理提供了足够的灵活性;另一方面,FOLIO设计了单独的实体管理APP,进行跨域的实体规范控制。这不仅可以对本地规范数据和取值词表进行创建、发布和永久URI维护,也可以对外部多源数据进行整合与利用。
- 许磊
- 关键词:图书馆集成系统元数据管理FOLIO