教育部人文社会科学研究基金(13YJA740060)
- 作品数:2 被引量:24H指数:2
- 相关作者:吴云芳李炜万富强更多>>
- 相关机构:北京大学更多>>
- 发文基金:教育部人文社会科学研究基金国家自然科学基金国家社会科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于序列模式的应答需求句识别
- 本文针对在线问答系统的问题识别任务,提出了"应答需求句"的概念,包括疑问句和祈使句两类句式,从训练数据中自动挖掘频繁使用的序列模式,训练SVM分类器。相比较于单一的问号特征、疑问词特征、疑问语气词特征以及词袋词特征,本文...
- 徐艺峰吴云芳
- 关键词:问句
- 文献传递
- 深度学习中汉语字向量和词向量结合方式探究被引量:15
- 2017年
- 该文旨在探究深度学习中汉语字向量和词向量的有效结合方式。我们在以词作为基础语义单元和以字作为基础语义单元这两个方向进行探究,实验了字、词信息多种浅层结合方式和深层结合方式。为了验证该文提出的结合方式的有效性,我们改进了一种compare-aggregate模型,并在基于文档的问答系统上进行了实验。实验结果表明,有效的汉语字向量和词向量的结合方式超越了单独的字向量和词向量,提升了基于文档的问答系统的性能,使其结果与目前最好的结果可媲美。
- 李伟康李炜吴云芳
- 关键词:问答系统
- 基于中文维基百科的词语语义相关度计算被引量:9
- 2013年
- 语义相关度计算在信息检索、词义消歧、自动文摘、拼写校正等自然语言处理中均扮演着重要的角色。该文采用基于维基百科的显性语义分析方法计算汉语词语之间的语义相关度。基于中文维基百科,将词表示为带权重的概念向量,进而将词之间相关度的计算转化为相应的概念向量的比较。进一步,引入页面的先验概率,利用维基百科页面之间的链接信息对概念向量各分量的值进行修正。实验结果表明,使用该方法计算汉语语义相关度,与人工标注标准的斯皮尔曼等级相关系数可以达到0.52,显著改善了相关度计算的结果。
- 万富强吴云芳
- 关键词:语义相关度先验概率