施少敏
- 作品数:2 被引量:1H指数:1
- 供职机构:浙江大学计算机科学与技术学院更多>>
- 发文基金:国家教育部“211”工程国家自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 中医方剂信息模式学习及方剂聚类
- 2011年
- 针对中医药方剂信息的特点提出了一种新型的方剂概念模型,并利用机器学习理论对非结构化的文本特征以及其内容组织形式加以学习,得到方剂概念的抽取模式。该模式学习的方法有效地解决了方剂非结构化文本抽取的难题,被用于中美百万册数字图书馆的方剂文本处理。而对抽取的方剂属性信息作聚类,则发掘了不同方剂药性药效间的联系,为中医药方剂查询模块提供推荐服务。
- 杨艳施少敏
- 关键词:数字图书馆信息抽取聚类
- NPOS最短路径分词实现方剂药物信息提取被引量:1
- 2010年
- 以中医方剂药物组成信息提取为背景,描述了突破中医药信息化过程中非结构化数据制约的一种方法,介绍了文本信息提取的主要技术步骤。所提出的信息提取框架涵盖了个性化中药词库建立、页面方剂信息定位、方剂组成文本分割、以及药物组成信息提取等。方剂信息的提取以基于正则表达式为主,同时考虑了中医药书籍的特殊性。组成文本分词采用了NPOS最短路径分词算法,提取药物时针对中医方剂中名词、量词、动词的特殊情况做了相应处理。实验表明,该方法能得到较高的提取正确率。
- 施少敏杨艳魏宝刚
- 关键词:方剂