您的位置: 专家智库 > >

邵健

作品数:3 被引量:9H指数:2
供职机构:南京理工大学经济管理学院更多>>
发文基金:国家社会科学基金教育部人文社会科学研究基金更多>>
相关领域:文化科学自动化与计算机技术更多>>

文献类型

  • 3篇中文期刊文章

领域

  • 2篇文化科学
  • 1篇自动化与计算...

主题

  • 1篇对齐
  • 1篇语料
  • 1篇社会化标签
  • 1篇平行语料
  • 1篇情感分类
  • 1篇最近邻
  • 1篇文本
  • 1篇文本表示
  • 1篇文本分类
  • 1篇文本挖掘
  • 1篇联网
  • 1篇句子对齐
  • 1篇互联
  • 1篇互联网上
  • 1篇机器翻译
  • 1篇翻译
  • 1篇TWITTE...
  • 1篇标签

机构

  • 3篇南京理工大学
  • 2篇南京大学

作者

  • 3篇章成志
  • 3篇邵健
  • 1篇李蕾

传媒

  • 2篇现代图书情报...
  • 1篇图书与情报

年份

  • 2篇2015
  • 1篇2014
3 条 记 录,以下是 1-3
排序方式:
从互联网上自动获取领域平行语料被引量:2
2014年
【目的】对获取的双语语料进行分类,对分类后的双语语料进行句子对齐处理,生成领域平行语料。【方法】利用基于SVM算法的文本分类器对获取的中英双语语料进行分类。使用长度法和词汇法相结合的句子对齐工具对分类后的语料进行句子对齐工作,为提高句子对齐的正确率,利用人工对齐的中英平行语料计算中英文句子长度参数,结合中英双语词典,获取高质量的专业领域平行语料。【结果】使用该方法,对每个领域语料进行句子对齐后,取得95.45%的句子对齐正确率。计算得到的句子平均长度比为1.7777,方差为1.2640。【局限】由于双语语料的初始对齐程度比较好,因此句子对齐正确率可能不具有普遍代表性。【结论】从实验结果看,该方法是有效的,能够获取质量令人满意的领域平行语料。
邵健章成志
关键词:句子对齐文本分类平行语料机器翻译
Hashtag研究综述被引量:6
2015年
【目的】分析当前Hashtag研究思路和技术,归纳和总结当前Hashtag研究中所存在的问题,并提炼Hashtag研究的理论意义与实际意义,为更深入的Hashtag研究提供参考。【文献范围】以2007年至2015年的国际会议和国内外期刊的60篇文献作为主要研究对象。【方法】调研Hashtag研究及其应用的相关文献,对Hashtag研究中各环节涉及的方法进行分析和总结。【结果】Hashtag在用户使用、Hashtag挖掘与基于Hashtag的应用研究三方面存在一些可以深入研究的问题。【结论】未来应侧重于Hashtag的理论研究,如用户标注Hashtag的动机、影响Hashtag标注的因素等。在实际应用中,结合不同学科方法和多个领域的技术改善Hashtag在实际应用中的效果。
邵健章成志李蕾
关键词:文本挖掘社会化标签情感分类
文本表示方法对微博Hashtag推荐影响研究——以Twitter上H7N9微博为例被引量:1
2015年
在总结国内外Hashtag推荐方法和短文本表示方法的基础上,文章利用基于K最近邻(KNN)的Hashtag推荐方法,将微博文本表示为向量然后计算相似度,从语料中选出与目标微博最相似的微博文本,然后抽取候选Hashtag。文章比较了向量空间模型(VSM)、潜在语义分析模型(LSA)、隐含狄利克雷分布模型(LDA)、深度学习(DL)等四种文本表示方法对基于KNN的Hashtag推荐效果的影响。以Twitter上H7N9微博为测试数据,实验结果表明深度学习的文本表示方法在基于KNN的Hashtag推荐中取得最好的效果。
邵健章成志
关键词:文本表示
共1页<1>
聚类工具0