您的位置: 专家智库 > >

徐潇

作品数:1 被引量:4H指数:1
供职机构:西南大学计算机与信息科学学院更多>>
发文基金:国家自然科学基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 1篇中文期刊文章

领域

  • 1篇自动化与计算...

主题

  • 1篇实体词
  • 1篇体词
  • 1篇中文
  • 1篇消歧
  • 1篇NEWMAN
  • 1篇TF-IDF
  • 1篇FAST

机构

  • 1篇西南大学

作者

  • 1篇李莉
  • 1篇曾维刚
  • 1篇郭云龙
  • 1篇向宇
  • 1篇徐潇

传媒

  • 1篇计算机应用与...

年份

  • 1篇2016
1 条 记 录,以下是 1-1
排序方式:
多策略中文微博实体词消歧及实体链接被引量:4
2016年
在社交网络迅猛发展的今天,如何对有歧义的微博实体进行消歧和如何将微博实体连接到知识库已成为当今研究热点。对实体消歧和实体链接提出了多种策略方案。首先利用ICTCLAS对微博文本进行分词处理,利用百度百科、实体专家库对实体进行规范化处理。然后利用由爬虫爬取的百度百科信息、微博数据、网络词语构建了消歧文本数据库,再结合TF-IDF算法和FastNewman聚类算法对实体进行消歧和链接。使用第二届自然语言处理与中文计算会议(NLP&CC 2013)中的中文微博实体链接任务给的数据进行测试,测评中准确率为84.99%,继续改进模型后准确率达91.40%。
向宇郭云龙徐潇曾维刚李莉
关键词:TF-IDF
共1页<1>
聚类工具0