您的位置: 专家智库 > >

国家自然科学基金(40971231)

作品数:13 被引量:196H指数:9
相关作者:张雪英张春菊朱少楠徐希涛王曙更多>>
相关机构:南京师范大学合肥工业大学利兹大学更多>>
发文基金:国家自然科学基金国家高技术研究发展计划江苏省普通高校研究生科研创新计划项目更多>>
相关领域:天文地球自动化与计算机技术经济管理更多>>

文献类型

  • 13篇期刊文章
  • 1篇会议论文

领域

  • 12篇天文地球
  • 2篇自动化与计算...
  • 1篇经济管理

主题

  • 6篇中文
  • 3篇中文文本
  • 2篇地理
  • 2篇地理空间
  • 2篇地名
  • 2篇语料
  • 2篇自然语言
  • 2篇标注语料库
  • 1篇代码
  • 1篇地籍
  • 1篇地理实体
  • 1篇地理要素
  • 1篇地名识别
  • 1篇地名数据库
  • 1篇地名信息
  • 1篇信息抽取
  • 1篇行政隶属关系
  • 1篇映射
  • 1篇语义
  • 1篇时间信息

机构

  • 14篇南京师范大学
  • 1篇合肥工业大学
  • 1篇南京邮电大学
  • 1篇国家基础地理...
  • 1篇教育部
  • 1篇云南省地震局
  • 1篇国土资源
  • 1篇利兹大学

作者

  • 13篇张雪英
  • 8篇张春菊
  • 7篇朱少楠
  • 3篇徐希涛
  • 2篇王曙
  • 2篇杜超利
  • 2篇李明
  • 1篇龙毅
  • 1篇闾国年
  • 1篇余明朗
  • 1篇明小娜
  • 1篇李伯秋
  • 1篇沈陈华
  • 1篇赵仁亮
  • 1篇吉雷静
  • 1篇陈晓丹
  • 1篇陈文君
  • 1篇余浩
  • 1篇吉蕾静
  • 1篇王德江

传媒

  • 4篇地理与地理信...
  • 2篇武汉大学学报...
  • 2篇测绘学报
  • 2篇地球信息科学...
  • 1篇测绘通报
  • 1篇中国土地科学
  • 1篇地球信息科学

年份

  • 1篇2014
  • 2篇2013
  • 7篇2012
  • 2篇2011
  • 2篇2010
13 条 记 录,以下是 1-10
排序方式:
中文文本中时间信息解析方法被引量:17
2014年
探讨了基于触发词汇和规则模型相结合的中文文本中时间信息解析方法。通过分析、归纳中文文本中时间信息描述特点,构建时间词汇词典和时间信息描述模式库,设计时间信息抽取、规范化表达和语义推理算法,实现了中文文本中时间信息的解析。实验结果表明,中文文本中时间信息抽取的准确率、召回率和F1值分别为75.00%、88.24%和40.54%,为泛在时空信息动态关联更新和实时挖掘分析提供数据源,且通过与空间维数据有机地、交互地组织,能够实时展现地理现象和事物的时空演化过程、时空分布特征,从而推动地理信息检索、LBS等地理信息服务向动态化、多维化方向发展。
张春菊张雪英李明王曙
关键词:中文文本
面向网页文本的地理要素变化检测被引量:15
2013年
地理要素变化检测已成为国家地理信息"十二五"规划和全国地理国情普查的重要组成部分。网页文本中蕴含海量的地理要素信息,尤其是新闻、政府、社交平台等网站的网页文本更新频繁,可为地理要素变化检测提供现势性的数据源。本文针对网页文本中地理要素变化的语言描述特点,构建了表达地理要素变化的语义知识库,设计了搜索引擎和通用主题相结合的网页爬虫,实现了相关网页文本的高效获取;采用规则模型和条件随机场模型,分别进行网页文本中地理要素变化信息抽取,包括地理要素名称、位置(地名)、时间和属性等。实验结果显示,本文设计的网页爬虫具有较高的相关网页文本获取能力,地理要素变化信息抽取的准确率能够达到70%以上,但是,语义知识库的完备程度对于信息抽取性能具有较大影响。研究成果表明,以网页文本为数据源的地理要素变化信息获取方法,能提供一种快速检测地理要素变化的新途径,与实地调绘和遥感影像检测等方法结合应用具有较好的优势互补性,可作为有力的辅助手段解决地理要素的持续更新和实时更新问题。
王曙吉雷静张雪英赵仁亮陈晓丹余浩
关键词:网页文本信息抽取文本解析
空间关系词汇与地理实体要素类型的语义约束关系构建方法被引量:12
2012年
为克服依赖常识人工归纳总结的局限性,采用定性和定量相结合的方式,自动构建空间关系词汇与地理要素类型的语义约束关系。首先,以《中国大百科全书(地理版)》空间关系标注语料库为基础数据,采用Overlap语义相关度计量方法,挖掘空间关系词汇与地理要素类型约束关系的先验知识;然后以地理要素分类体系提供的概念语义相关性对先验知识进行扩展;最后采用本体工具Protégé建立相关知识库。
张雪英张春菊杜超利
关键词:地理实体
GIS环境下中文命令的规则匹配与语义解析被引量:3
2012年
提出了特征词双重属性的构建策略,为带有约束条件的中文命令直接转化为GIS操作提供了解决方法。针对复杂的空间、属性约束条件,定义了条件文法并设计了规则模板的生成算法;通过特征词的双重属性建立了中文命令与GIS功能函数之间的联系,采用规则匹配、函数映射方法实现中文语义解析。在此基础上,通过实例研究验证了方法的可行性。
余明朗明小娜龙毅张雪英
关键词:GIS特征词
地理空间关系描述的句法模式识别
地理空间关系是地理信息科学的重要问题之一。自然语言中包含着大量的空间关系,是空间关系研究的一种重要途径。句法模式是自然语言中地理空间关系描述的重要语言特征,在自然语言中空间关系信息抽取、GIS自然语言空间关系查询和理解、...
朱少楠张雪英张春菊
关键词:句法模式识别
中文文本的地理命名实体标注被引量:27
2012年
地理信息的语义解析有效地解决自然语言与地理信息系统之间的语义障碍问题。在分析中文文本和地理信息系统中地理实体描述和表达机制差异的基础上,结合地理命名实体描述的语言特点,制定中文文本的地理命名实体标注体系和标注规范,并以GATE(General Architecture for Text Engineering)作为标注平台,构建基于《中国大百科全书中国地理》的大规模标注语料库,以解决当前相关标准和规模化标准数据匮乏的问题。
张雪英朱少楠张春菊
关键词:中文文本标注语料库自然语言
宗地统一编码过程中新旧代码无损转换方法被引量:5
2012年
研究目的:通过对宗地统一编码分析,研究旧宗地代码向新宗地代码无损转换的方法。研究方法:理论分析与实例验证相结合。研究结果:(1)宗地统一编码过程中,应使用相同的范围作为城镇地籍调查、村庄地籍调查和农村土地利用现状调查的地籍区和地籍子区的范围;(2)对城镇地籍调查、村庄地籍调查中的调查区与街坊组合代码进行压缩,可实现新旧宗地代码的无损转换;(3)江苏省仪征市的转换实践表明该方法可行。研究结论:所有权宗地与使用权宗地新旧代码无损转换方法具有广泛的应用前景。
沈陈华王德江
关键词:地籍
基于网络爬虫的地名数据库维护方法被引量:24
2011年
目前,我国地名数据库建设存在大、中颗粒度地名集中,小颗粒度地名较为缺乏,地名资料陈旧、时效性较低,简称、别名等非标准地名信息和地名的相对位置信息缺失等问题。而地名数据库的更新维护工作主要通过人工测绘手段完成,存在周期长、成本高、效率低等缺点。针对这一问题,本文以现有地名数据库和空间关系词汇为基础,基于Google搜索引擎服务,提出一种以网页资源为数据源,利用网络爬虫技术和地名识别技术,进行地名数据库更新维护的方法。首先,设计以地名为主题的网络爬虫,实现非结构化的网页数据中海量空间敏感网页文本的主动获取;然后,采用HTML DOM技术解析空间敏感网页并应用CRF地名识别模型自动识别网页文本中地名;最后,设计相关算法进行网页文本中地名信息的自动解析,实现新地名和地名空间位置信息的获取,进行地名数据库的更新维护。以"南京师范大学仙林宾馆+西北"为空间检索实例,验证了此方法的可行性。
张春菊张雪英朱少楠徐希涛
关键词:地名数据库网络爬虫地名识别主题相关性
基于XML Schema的多源地名词典集成方法被引量:5
2012年
目前,我国已经构建大量不同级别、面向不同应用的地名词典,网络大众化地名服务成为地名词典的必然发展趋势。该文提出一种基于XML Schema的多源异构地名词典集成方法,以XML Schema对地名词典进行数据描述,采用XSLT数据转换方法,运用MapForce软件,快速进行地名词典的数据结构映射,能够有效解决地名词典的跨平台及数据类型不统一问题。
张雪英朱少楠张春菊徐希涛杜超利
关键词:XMLSCHEMA数据集成XSLT
中文文本的地理空间关系标注被引量:22
2012年
为有效地解决当前相关标准和标准数据匮乏的问题,通过分析中文文本中地理空间关系描述的语言特点,提出中文文本的地理空间关系标注体系,并以GATE(General Architecture for Text Engineering)为标注工具,以《中国大百科全书中国地理》为文本数据源,采用交叉校验方式建立了地理空间关系标注语料库。实现了中文文本中地理空间关系描述的结构化表达,提供了地理空间关系信息抽取的标准化测试数据。
张雪英张春菊朱少楠
关键词:自然语言中文文本标注语料库
共2页<12>
聚类工具0