江西省教育厅科学技术研究项目(11731)
- 作品数:2 被引量:17H指数:2
- 相关作者:万常选刘德喜钟敏娟江腾蛟刘喜平更多>>
- 相关机构:江西财经大学更多>>
- 发文基金:国家自然科学基金江西省教育厅科学技术研究项目国家社会科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于结点权重模型的XML片段检索策略被引量:5
- 2013年
- 当用户向XML检索引擎提交查询后,返回的结果通常远远多于用户的期望,返回结果中难免有一些不相关的文档或结点.对于以文档为中心的XML文档集合,XML片段检索是根据用户的查询,从XML检索引擎返回的XML文档或结点中抽取出仅包含数百字节的片段,用户可以通过该片段判断片段所在的XML文档或结点与查询的真实相关性,以决定是否有必要进一步阅读,从而有效地提高从XML文档中获取信息的效率.该文提出了基于结点权重模型的XML片段检索策略.该策略先利用结点权重模型ATG(平均主题概括强度)对XML文档集中的标签或路径设置权重,再将该权重用于BM25模型,得到BM25NW检索模型.在利用BM25NW检索出XML结点后,对结点中定长窗口进行评分,考察其是否适合作为片段内容.最后在保证信息冗余较小的条件下,选择得分较高的窗口内容组成片段返回给用户.INEX 2011片段检索任务上的评测结果显示,基于结点权重模型ATG的XML片段检索策略具有很强的竞争力,性能明显优于其它参赛系统.
- 刘德喜万常选刘喜平钟敏娟江腾蛟
- 社会化短文本自动摘要研究综述被引量:12
- 2013年
- 随着Twitter、新浪微博等社会网络的蓬勃发展,社会化短文本逐渐进入研究者的视野,在该方向上的研究成果正在逐年扩大.在分析社会化短文本摘要的意义之后,综述了社会化短文本的研究现状.社会化短文本摘要方面的研究成果主要有三类,面向Web文档的自动摘要、面向事件的自动摘要、面向话题(或查询)的自动摘要.其中,面向话题(或查询)的社会化短文本自动摘要是对社会网络中海量短文本进行高效访问的重要手段.文中重点分析四种面向话题(或查询)的社会化短文本自动摘要的最新研究成果,包括:基于词频的方法、基于图的方法、基于合并的方法及基于优化的方法.最后指出社会化短文本自动摘要所面临的挑战和研究方向.
- 刘德喜万常选
- 关键词:面向查询社会关系