李伯秋
- 作品数:4 被引量:80H指数:2
- 供职机构:南京师范大学地理科学学院虚拟地理环境教育部重点实验室更多>>
- 发文基金:国家自然科学基金国家高技术研究发展计划更多>>
- 相关领域:天文地球自动化与计算机技术更多>>
- 基于规则的中文地址要素解析方法被引量:73
- 2010年
- 在日常生产与生活中,地址是最常见的使用自然语言描述地理位置的参考系统之一。地址地理编码技术被认为是大量业务数据的G IS实现可视化定位和空间分析的桥梁,在房地产管理、土地管理、城市规划、公安、邮政、税收、电讯和公共卫生等领域中具有十分重要的应用前景。地址要素解析是中文地址编码的核心技术之一。它是将自然语言描述的地址拆分为在某一限定区域内,可以指定某一地理范围的地址要素的过程。实际上,这个过程可以被看作是一种特定的中文分词任务。由于语言和文化的原因,中文地址描述采用连续的字符串,而且普遍存在不规范现象。目前,采用的地址解析方法在较大程度上受限于词典的更新维护和规则的不完备问题。本文以大规模地名词典和地址数据库为数据源,通过系统分析地址要素的构词特征和句法模式,构建了各类地址要素的特征字库,提出了中文地址的数字表达方法,设计了RBAI中文地址要素解析算法,开发了相应的原型系统。实验结果准确率达到92%以上,处理效率达2800条/秒。这表明该方法符合大规模数据处理的应用需求,具有重要的推广应用价值。
- 张雪英闾国年李伯秋陈文君
- 关键词:中文地址
- 中文地址编码关键技术的研究
- 地址编码是联系空间地理信息与非空间地理信息的桥梁,是各种应用地理信息系统中必不可少的环节,也是数字城市的基础性组成部分。然而,由于中文地址自身的诸多原因,使得中文地址编码存在很多难点问题,以至于国外在地址编码方面的许多成...
- 李伯秋
- 文献传递
- 基于条件随机场的中文地址要素识别方法被引量:20
- 2010年
- 由于中文地址命名的不规范性和汉语语言特点,中文地址要素识别成为地址编码的关键技术。传统的特征字匹配和字典匹配方法,难以解决地址要素命名的多样性问题。借鉴自然语言处理技术,通过构建地址要素标注集,设计了基于条件随机场的中文地址要素识别方法。实验证明,与基于特征字的规则方法相比,基于条件随机场的方法能够在较大程度上提高识别效果。由于条件随机场模型具有较好的泛化能力,该方法具有更强的通用性,特别适宜于大规模地址数据的批量解析和大众化位置服务中地址编码的快速处理。
- 蒋文明张雪英李伯秋
- 关键词:自然语言处理条件随机场
- 面向地址编码的中文地址语义解析方法
- 本发明公开了一种面向地址编码的中文地址语义解析方法,其步骤如下:第一步:根据样本数据,构建地址特征字库;a.建立样本数据;b.筛选特征字;c.筛选附属特征字;所筛选的特征字和附属特征字构成了特征字库;第二步:根据特征字库...
- 张雪英申琪君李伯秋陈文君
- 文献传递