您的位置: 专家智库 > >

孙赫

作品数:3 被引量:2H指数:1
供职机构:北京信息科技大学计算机学院更多>>
发文基金:北京市重点实验室开放基金北京市教委科技发展计划国家自然科学基金更多>>
相关领域:自动化与计算机技术文化科学更多>>

文献类型

  • 2篇期刊文章
  • 1篇学位论文

领域

  • 3篇自动化与计算...
  • 1篇文化科学

主题

  • 3篇投诉
  • 3篇文本
  • 3篇城市
  • 2篇互动
  • 1篇爬虫
  • 1篇完整性
  • 1篇网络
  • 1篇网络爬虫
  • 1篇规则库
  • 1篇CRF

机构

  • 3篇北京信息科技...
  • 2篇北京理工大学
  • 2篇北京城市系统...

作者

  • 3篇孙赫
  • 2篇吕学强
  • 2篇李淑琴
  • 2篇刘克会

传媒

  • 1篇现代图书情报...
  • 1篇山东大学学报...

年份

  • 2篇2016
  • 1篇2015
3 条 记 录,以下是 1-3
排序方式:
微博城市投诉文本中的地理位置实体识别被引量:2
2016年
微博投诉文本中地理位置实体通常存在结构复杂,长度较长,描述较详细的特点。通过对投诉微博文本的分析,提出了地理位置实体自动识别的方法。该方法首先利用特征资源库对微博进行特征标注,使用条件随机场(conditional random fields,CRF)模型识别地理位置实体。其次根据微博和地理位置实体的特点,对CRF识别后的数据进行二次标注。最后利用微博规则库对识别结果进行补召,修正地理位置实体,最终实现地理位置实体的识别。实验结果表明该方法有显著效果,F值可达到85.52%。
孙赫孙赫李淑琴吕学强
关键词:CRF
微博城市投诉文本中地理位置实体的完整性研究被引量:1
2016年
【目的】利用互动问答社区——百度知道的知识共享、更新及时的优势,弥补维护大规模地理隶属关系资源库开销大的不足,并通过百度知道自动补全缺陷地理位置实体。【方法】对缺陷地理位置实体转化为所属区域问题,并通过百度知道进行检索;根据检索结果提取特征,计算该地理位置实体属于各个区域的得分,并构建缺陷地理位置实体的所属区域特征向量;利用规则对缺陷地理位置实体进行完整化处理,实现地理位置实体完整性表示。【结果】在完整化微博城市投诉文本中的缺陷地理位置实体时,该方法的综合精确率达到92.51%。【局限】对零地理位置实体无法完整表示。【结论】该方法对缺陷地理位置实体完整化是有效的、可行的。
孙赫李淑琴吕学强刘克会
基于微博的城市投诉文本的挖掘与分析
近几年,随着微博问政的兴起,越来越多的政府部门开设官方微博与百姓互动。例如,“北京12345”作为政务微博的正式开通,极大方便了群众反映非紧急救助服务类诉求。由于微博平台的大众化、平民化,且用户操作便捷,使得每天收到的投...
孙赫
关键词:网络爬虫
文献传递
共1页<1>
聚类工具0