孙泰
- 作品数:7 被引量:10H指数:3
- 供职机构:全国组织机构代码管理中心更多>>
- 发文基金:国家科技支撑计划中央高校基本科研业务费专项资金质检公益性行业科研专项项目更多>>
- 相关领域:自动化与计算机技术天文地球更多>>
- 基于转移学习的中文命名实体识别被引量:4
- 2018年
- 中文命名实体识别在多个重要领域有广泛的运用,提出一种基于转移学习的算法进行中文命名实体识别,旨在提高识别的准确率和召回率。基于转移学习算法的中心思想是开始以一些简单的结论应用于问题,然后在每个步骤应用转换,选择出每次转换的最优结论再次应用于问题,当选择的转换在足够的空间内不再修改数据时算法停止。提出算法的规则模板和约束文件的获取方法,形成一个完整的用于中文命名实体识别的模型,并利用该模型进行实验,获得了较好的结果。
- 周法国吴锡坤孙泰孙镇
- 关键词:命名实体识别准确率召回率
- 面向大数据的图数据处理技术被引量:3
- 2015年
- 大数据时代,数据规模爆炸性增长,传统的数据处理技术已无法满足需求。"图"这一抽象数据能够充分表示数据间的关系。现实世界中的许多应用场景可以用图结构来表示。文中结合大数据的特点,从图数据管理与图数据处理机制两个方面,综述了大数据背景下图数据处理的关键问题。总结了当前的研究现状和进展,分析了存在的挑战性问题,并深入探讨了未来的研究方向。
- 罗征王赛张帆孙泰
- 关键词:大数据数据管理
- 基于改进场模型的城市腹地划分方法——以山东省为例被引量:3
- 2016年
- 针对传统城市腹地划分方法很少考虑阻碍因素的不足,该文将阻碍因素引入场模型,改进场模型中的城市综合规模,提出了基于改进场模型的城市腹地划分方法,较好地界定了城市影响范围;基于改进的场模型,实现了城市势力范围合理划分。以山东省17个地级市为研究对象,开展了城市腹地划分验证分析,实验结果表明:山东省各城市势力范围差异较大,中心城市的势力范围远远超出其行政范围,各城市势力圈与市域行政范围吻合性有待提高。研究表明城市腹地范围是由中心城市和周边城市的实力共同决定,是对城市经济区的重新界定,对城市体系规划和结构调整有一定参考意义。
- 张立芳王亮赵荣徐胜华金江孙泰宫政
- 关键词:城市腹地主成分分析GIS空间分析
- 一种组织机构代码中经济行业自动分类的装置
- 本发明涉及一种组织机构代码中经济行业自动分类的装置,包括如下模块:(1)分类规则维护模块,主要包括,构建存储类别特征词集,行业类别体系及产业体系,形成数字化标准分类体系,进行类别管理,词典管理及主题与范式管理;(2)小文...
- 孙镇金江宫政袁辉孙泰李晟飞
- 文献传递
- 基于主题词的文本案例检索算法研究
- 2013年
- 分析传统文本检索方法布尔检索的本质,发现该检索方法存在两个缺点:检索算法忽略了词语之间的语义关系以及不能对检索结果进行重要性排序,针对于此提出利用基于主题词的改进检索算法。通过丰富主题词构建关键词库,在语义信息检索框架的基础上,计算关键词的语义距离和相似度。最后将改进后的算法应用到灾情案例检索系统中,并对检索结果做性能分析,实验证明该算法在文本检索的查准率和查全率上都有较好的改善。
- 孙镇孙镇袁辉孙泰宫政赵捷
- 关键词:语义距离查准率查全率
- 一种组织机构代码信息质量数据模糊评估装置
- 本发明涉及一种组织机构代码信息质量数据模糊评估装置,包括存储模块、数据接收模块、创建权重模块、处理芯片、生成模块;根据组织机构代码信息质量的评价标准提出了组织机构代码信息质量指标体系,然后确定权重选取方法,使用相对度量方...
- 孙镇金江宫政袁辉孙泰李晟飞
- 文献传递
- 一种基于粒子群的海量组织机构数据分类方法及系统
- 本发明公开了一种基于粒子群的海量组织机构数据分类方法,首先采用微粒群构建数据分类规则;建立不同行业的分类规则;然后获取海量组织机构数据中的预选数据作为训练集和测试集,按照构建的分类规则进行数据集规则覆盖过程和测试评估,得...
- 孙镇孙泰赵捷袁辉金江李晟飞钱晓东宫政
- 文献传递