王星 作品数:32 被引量:152 H指数:7 供职机构: 中国科学技术信息研究所 更多>> 发文基金: 国家社会科学基金 国家科技支撑计划 国家科技图书文献中心项目 更多>> 相关领域: 文化科学 自动化与计算机技术 经济管理 环境科学与工程 更多>>
语义网环境下叙词表构建方法研究 被引量:5 2018年 【目的/意义】通过研究语义网环境下叙词表的构建方式,促进叙词表的共建和共享。【方法/过程】叙词表是进行知识组织的有效工具。从知识工程的角度,对语义网环境下叙词表的基本特征和构建方式进行分析,研究叙词表构建的技术模型与演进路径,为叙词表的编制、使用和维护提供新的思路和视角。进而,结合知识的多维度描述方法,对语义网环境下叙词表构建的有效性进行实证研究和展望。【结果/结论】《汉语主题词表》研究和实践表明,语义网环境下叙词表的共建共享在机制和技术上是可行的。 宋培彦 陈白雪 王星关键词:叙词表 知识组织 知识表示 语义网 术语知识库的构建与服务研究 被引量:6 2014年 术语知识库是开展知识服务的基础资源。基于知识组织理论设计统一的知识描述框架,对术语知识表示进行细粒度的刻画,构建专业术语知识库资源,进而探讨网络环境下开展术语服务的基本方式,设计了术语服务实验系统,初步证实了术语知识库的应用前景。 宋培彦 王星 李俊莉关键词:知识库 知识组织 一种数字图书馆集成服务平台的设计与实现 被引量:4 2012年 为解决当前数字图书馆用户服务工作平台建设面临的一些问题,提出了按照一体化、集成化的思路构建相应的平台系统,给出了包括架构设计、功能设计在内的平台设计方案,阐述了平台技术框架及实现方法,论述了基于工作流的业务协同管理机制及基于角色的安全访问控制机制,并以科技查新服务为例对实现效果进行了验证。 赵捷 苏静 王星 曾建勋关键词:系统设计 国家科技报告服务系统构建研究 被引量:5 2015年 国家科技报告服务系统建设是国家科技报告制度建设的重要工作之一。为构建国家科技报告服务系统,从系统功能、资源体系、收藏与服务管理流程等对系统构建需求进行调研分析,提出系统基本架构、功能框架、统一认证机制等关键设计,并给出系统技术实现的基本方案。 王星 赵捷关键词:信息系统 系统设计 资源体系 服务于资源建设的会议预报系统构建 2012年 文章通过对国外1000多个有会议信息的学协会网站进行分析,制定了会议信息采集策略,以及会议信息元数据集,并给出了人工规范会议信息的原则以及机器辅助抽取会议信息元数据的方法及步骤。最后,介绍了开发的会议预报系统的主要功能。 杨代庆 王星 常迎春关键词:信息采集 信息筛选 叙词表融合方法研究 被引量:7 2012年 多表融合过程中可能产生概念界定不一致,语义关系矛盾冲突、相互缠结的问题,加上多人协同工作模式的复杂性,致使知识体系梳理极为困难。从逻辑角度对"概念"、"词汇"及概念间"关系"进行界定,提出多表融合的技术路线。多表融合以多表概念映射为前提。由于词群构成的复杂性,需要对closeMatch映射进行语义分析,以区分出exactMatch映射。概念合并和新关系生成可能引发多种逻辑问题:关系冲突、等级关系循环、等级关系冗余、兄弟概念互参、上下位概念共参、交叉互参、等级关系多路径。这些逻辑问题可被区分为两大类:逻辑错误、逻辑优化,并进一步影响逻辑问题的解决步骤。讨论了多人协同工作模式下叙词表的数据锁定机制。图9。表1。参考文献11。 吴雯娜 王星关键词:语义关系 概念映射 同义词抽取结果的噪音清洗方法研究 2015年 【目的】同义词抽取结果中的噪音会严重影响结果的可应用性,需要预先进行清洗。【方法】提出一种基于同义关系网络的噪音清洗方法,将同义词抽取结果转化为无向结构的同义关系网络,在该网络中自动识别出同义词抽取结果中部分噪音,并结合语义的分布相似性对方法进行改进,以提高噪音的识别比例。【结果】通过在工程技术领域随机选取的术语上进行实验,表明该方法可以过滤同义词抽取结果中32.6%–73.0%的噪音。【局限】只能清除部分噪音,还需要改进方法以提高噪音识别的准确性。【结论】通过构建同义关系网络能够清洗同义词抽取结果中的噪音,该问题值得进一步深入研究。 刘伟 王星 宋培彦关键词:同义词 信息抽取 同义词检索结果按词义自动聚类方法 本发明提供一种同义词检索结果按词义自动聚类方法,包括以下步骤:S1,向同义词检索系统提交检索词进行一级检索,获得一级检索结果;S2,将所述一级检索结果中的每个词都进行二级检索,获得二级检索结果;S3,构建所述二级检索结果... 刘伟 王星文献传递 一种新术语自动发现识别方法 本发明公开了一种新术语自动发现识别方法,涉及数据库技术、自然语言处理和新术语自动识别技术领域。该方法首先从中文期刊论文文献的关键词获取候选新术语,然后根据候选新术语的词频在年代分布和学科分布上的特征对候选新术语进行筛选,... 刘伟 吴雯娜 王星 雷晓信息用户生存时间分布研究:以NSTL为例 被引量:3 2011年 利用生存分析方法,对国家科技图书文献中心用户的生存时间分布及其影响因素展开了研究,从而可知用户的高流失率和短中位生存时间主要由"游客"引起,经常用户的生存时间服从W e ibu ll分布;不同类型用户的生存时间存在显著性差异,赠卡用户的流失速度慢于非赠卡用户;请求频率和余额比例是用户流失风险的重要影响因素,余额比例越高,流失风险越低。针对分析结果,对加强国家科技图书文献中心的用户流失管理提出了相应的对策和建议。 赖院根 曾建勋 王星关键词:信息用户 用户分析 客户流失