杨林 作品数:24 被引量:60 H指数:4 供职机构: 中国医学科学院北京协和医学院医学信息研究所 更多>> 发文基金: 中央级公益性科研院所基本科研业务费专项 国家社会科学基金 北京市自然科学基金 更多>> 相关领域: 医药卫生 自动化与计算机技术 文化科学 更多>>
NIH生物医学数据共享仓储分析 2017年 目的:对美国国立卫生研究院(NIH)的共享仓储进行分析,为生物医学科学数据领域相关研究和我国医学科学数据共享仓储建设提供参考和借鉴。方法:对UniProt、Protein Data Bank、GenBank等10个典型的数据共享仓储进行对比分析,总结其在数据获取方式、数据管理及共享模式、服务方式等方面的经验。结果:各仓储根据自身特性,设计了符合自身特点的数据管理链条及流程规范。结论:我国可借鉴美国国立卫生研究院生物医学数据共享仓储的建设经验,设计数据服务工具、开展半人工半自动模式的数据审核,收集尽可能详尽的元数据,并制定符合自身仓储特点的引用规范等。 马鹤桐 吴思竹 杨林 郑慧霞关键词:科学数据 数据管理 数据共享 数据驱动的科学工作流及其在生物医学中的应用实践 2014年 E—science关注数字环境下的科研活动,然而随着生物医学大数据的爆发,数据密集型科学研究为e·Science~来了新的挑战。科学工作流通过形式化科学计算的流程,支持在一个专门的程序环境下自动协调多任务多步骤的处理,从而减少科研投入,提高科研效率。文章首先归纳筑总结了科学工作流的相关定义,然后分析了当前主流的科学工作流系统,提出科学工作流处理如何应对密集的生物医学数据,并基于Taverna开展了生物医学领域的科学工作流实验。最后总结了科学工作流当前的研究现状和存在的一些问题。 洪娜 钱庆 方安 吴思竹 杨林关键词:科学工作流 中国、美国、英国精准医学计划比较研究 被引量:16 2017年 选取具有国际影响力的中国、美国和英国三国的精准医学计划,简述计划主要目标和主要任务,从计划组织实施和数据管理共享方面进行比较分析,并总结获得的部分启示,以期为我国开展精准医学研究重点专项提供有益参考和借鉴。 吴思竹 钱庆 杨林关键词:基因组 数据管理 基于BERT-TextCNN的临床试验疾病亚型识别研究 被引量:3 2022年 【目的】面向复杂疾病临床试验招募的需求,提出一种基于BERT-TextCNN的临床试验疾病亚型识别方法,辅助识别复杂疾病特定亚型的受试人群。【方法】将临床试验疾病亚型识别问题转化为单标签分类问题,应用基于BERT-TextCNN的单标签分类模型进行分类,以卒中为例在临床试验数据集(ClinicalTrials.gov)上开展实验验证。【结果】基于LP法的BERT-TextCNN模型性能最佳,加权宏平均F1值为0.9053,可以有效判定一项卒中临床试验可纳入卒中亚型受试者情况。【局限】缺乏在其他单病种上的可行性研究,以及在外部数据集上的有效性验证。【结论】本文方法可以有效解决从纳入标准中准确识别复杂疾病亚型的问题。 杨林 黄晓硕 王嘉阳 丁玲玲 李子孝 李姣关键词:文本分类 卒中 应用于专病临床试验的队列识别方法及装置 本发明公开了一种应用于专病临床试验的队列识别方法及装置,基于预创建的专病临床试验入排标准的知识体系,生成专病临床试验入排标准的查询信息;获取电子病历数据,并对电子病历数据进行信息分析,得到专病表型分析信息;基于专病表型分... 杨林 李姣 黄晓硕文献传递 跨领域数据审编(Curation)流程研究——以环境健康数据为例 被引量:2 2015年 【目的】顺应环境健康跨领域科学数据管理需求,探索跨领域数据的审编工作流程,为推进相关领域数据管理工作提供可行性方案。【方法】基于环境健康领域研究,在DCC审编生命周期模型指导下,构建环境健康数据审编工作流程,明确各审编模块的内容以及人工审编、自动化审编的边界。【结果】应用构建的工作流审编气象环境数据与医院就诊数据,可支撑医药卫生知识服务系统中环境健康数据部分的审编工作,结果显示环境健康数据审编工作流程具有一定的可操作性。【局限】由于需求的多样性,流程在实际操作时需要在数据模型、数据规范化等方面进一步细化。【结论】环境健康数据审编流程能够有效地组织不同专业背景的审编人员,兼顾数据质量和数据规模两方面的考量,在解决跨领域数据审编方面具有一定的可操作性。 杨林 李姣 侯丽 钱庆关键词:环境健康 人机交互技术在解剖学教育中的应用 被引量:3 2021年 阐述人机交互技术在解剖学教育中的应用,介绍人机交互技术相关教学工具,对比传统教学工具与人机交互教学工具在解剖学教学中的优劣势,促进教育工作者采用新型教学技术。 马鹤桐 杨林 李姣关键词:人机交互 智能技术 体验式教学在围产保健管理继续教育培训中的应用 2024年 目的/意义探讨体验式教学模式在围产保健管理继续教育培训中的应用效果。方法/过程由北京协和医院围产保健团队面向30位来自全国各地的孕产医护人员开展为期4天的体验式课堂教学。通过自制问卷分析学员在体验式课堂后临床技能提高、临床适用性、教育需求满足情况以及对课程教学内容、课程时间、教学设计、课堂氛围、教学形式的满意度,采用李克特量表对教学效果量化反馈。结果/结论体验式教学模式在围产保健管理继续教育领域教学效果较好,有较好应用前景。未来应与理论式教学相结合,开展更完善、结构化的全国范围内的周期性教学,提升围产保健工作者的相关理论基础和临床技能,以更好地为孕产妇提供健康保健服务。 张素菡 杨林 杨毅 李晓菲 孙振凤 林航 王敏 刘娜娜 王亚新 杨萱瑾 刘利 朱灿 李姣 马良坤关键词:体验式教学 继续教育 教学评估 基于语义对齐的临床量表信息提取方法及其临床试验队列识别的应用研究 被引量:2 2020年 【目的】面向真实世界数据驱动的临床研究需求,提出一种基于语义对齐的临床量表信息提取方法,辅助识别潜在受试人群。【方法】选取卒中量表NIHSS,分析量表信息在临床试验和真实世界电子病历中的特征,构建基于语义对齐的量表信息提取方法,应用临床试验数据集(ClinicalTrials.gov)和开放电子病历数据集MIMIC-Ⅲ开展实验验证。【结果】从患者出院小结中抽取NIHSS总评分、检查项评分的F1值分别为0.9535和0.9267;围绕两项匹配NIHSS纳排标准的测试任务,可以有效地识别出潜在受试人群。【局限】缺乏在其他量表上的可行性研究,以及在真实临床试验环境中的有效性和可靠性验证。【结论】本方法可以有效地解决临床量表信息在临床研究与电子病历数据的语义一致性问题。 杨林 黄晓硕 王嘉阳 李姣基于USGS生命周期模型的肿瘤流行病学数据管理研究 被引量:2 2017年 随着科研数据的增长,对海量数据进行有效的管理和利用成为科学数据共享的研究重点之一。基于USGS数据生命周期模型,以国际癌症研究中心(IARC)发布的肿瘤流行病学发病数据和相应的人口数据为分析对象,介绍了数据的整合与管理方法,为科研人员提供整合和管理科学数据的具体案例和可行性方法,为制定宏观政策提供基础数据和知识支撑。通过使用USGS数据生命周期模型,实现了对不同类型数据的对比分析,验证了数据生命周期模型在数据管理方面的有效性。 刘燕 杨林 侯丽 李姣关键词:科学数据 流行病学 肿瘤