湖北省自然科学基金(2009CDB145)
- 作品数:2 被引量:9H指数:2
- 相关作者:何婷婷李芳宋乐更多>>
- 相关机构:华中师范大学更多>>
- 发文基金:武汉市青年科技晨光计划湖北省自然科学基金国家自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于LDA模型的文本聚类研究
- LDA(Latent Dirichlet Allocation)是近年来提出的一种具有文本主题表示能力的非监督学习模型。本文提出了一种基于LDA主题模型的文本聚类和聚簇描述方法。利用LDA模型挖掘隐藏在文本内的不同主题与...
- 董婧灵李芳何婷婷涂新辉万剑
- 关键词:主题模型LDA文本聚类
- 文献传递
- 面向查询的多模式自动摘要研究被引量:4
- 2011年
- 为了满足用户的个性化需求,提供尽可能丰富、实用、方便的文摘结果,该文设计了面向查询的多文档自动文摘的多种摘要模式。在将查询返回的文档集合表示为以文本、段落为节点的双层复杂网络结构以发现子主题的基础上,除传统的摘要模式外,该文又设计了概括摘要、局部摘要、全局摘要和详细摘要这四种摘要模式,并给出了各种摘要的生成方法。支持用户以主题为线索自主漫游,按照一定的逻辑顺序浏览信息。
- 李芳何婷婷
- 基于PMI-IR算法的Blog情感分类研究
- Blog信息源和信息量的广泛增长给中文文本分类带来了新的挑战。本文提出了一种基于PMI-IR算法的四种情感分类方法来对Blog文本进行情感分类。该方法以情感词语为中心,通过搜索引擎返回的结果来计算文本中的情感要索和背景情...
- 段秀婷何婷婷宋乐
- 关键词:中文信息处理情感分类互信息
- 文献传递
- 中文维基百科的结构化信息抽取及词语相关度计算
- 本文首先从中文维基百科官方所提供的基本数据中抽取整理出多种结构化信息;接着,对维基百科的知识组织形式进行了抽取架构,实现了一套开放的框架接口,方便了用户对这些信息的获取和使用;在此基础上,进行了词语间语义相关度计算的实验...
- 张红春何婷婷涂新辉周琨峰
- 关键词:语义相关度结构化信息
- 文献传递
- 评价主题挖掘及其倾向性识别被引量:5
- 2012年
- 主要研究如何从在线评论文本中挖掘产品的评价主题,并对其倾向性进行分析。首先采用一种启发式规则和共现概率统计相结合的方法识别文本集合中的名词性短语,再运用LDA模型挖掘潜在的评价主题。然后利用多特征融合的方法计算句子的倾向性,进而根据特征词群统计出各主题的倾向性结果。最后通过对网络汽车评论文本语料的实验证实了该方法的有效性。
- 李芳何婷婷宋乐
- 关键词:LDA
- 面向查询的多模式自动摘要研究
- 为了满足用户的个性化需求,提供尽可能丰富、实用、方便的文摘结果,本文设计了面向查询的多文档自动文摘的多种摘要模式。在将查询返回的文档集合表示为以文本、段落为节点的双层复杂网络结构以发现子主题的基础上,除传统的摘要模式外,...
- 李芳何婷婷
- 文献传递
- 基于网络百科全书的中文关联语义知识获取
- 本文提出了一种用语义标签、语义指纹来表示关联语义知识的形式化方法,其中语义标签指代语义中的一个知识单元(也即概念),语义指纹是对语义标签所指代概念的描述,由语义标签的相关词语及其关联度共同组成。本文提出了一种从网络百科全...
- 杨柳何婷婷涂新辉
- 关键词:百科全书语义知识
- 文献传递
- 基于概率和句法分析的中文句子修剪
- 提出了一种中文句子修剪方法。引入噪音通道模型,经过改进,提出了更适合句子修剪任务的Bi-NC模型。引入无导的方法,解决了中文中缺乏原句-压缩句对齐语料的瓶颈问题。提出了一种自底向上的层级优化算法,避免在优化过程中删除最优...
- 陈劲光何婷婷李芳桂卓民
- 关键词:句法分析
- 文献传递