袁冬生
- 作品数:1 被引量:6H指数:1
- 供职机构:浙江大学生物医学工程与仪器科学学院更多>>
- 发文基金:国家自然科学基金国家高技术研究发展计划更多>>
- 相关领域:医药卫生更多>>
- 中文医疗文本匿名化方法研究被引量:6
- 2014年
- 医疗文档的匿名化工作能够有效保护患者隐私,推动中国电子病历匿名化的发展。但传统的人工筛检患者隐私信息方法不仅效率低下,错检、漏检频繁,且消耗大量人力资源。针对这一问题,引入中文分词技术,提出并实现了一种基于中文分词技术的识别并处理中文人名的算法。该方法通过对医疗文本当中的自然句切割和切词以及充分挖掘姓名和其上下文信息的关联程度,实现了在电子病历中批量处理中文医疗文档。通过此方法,人名的检出率达到96.80%,超过临床人员对PHI的人工平均检出率81%,同时获得了90.57%的精确率。在保护患者隐私的同时,最大化地减少匿名化对医疗文档临床医用价值的影响。
- 徐益辉姚琴袁冬生周天舒李劲松
- 关键词:中文分词隐私保护