江苏省高校自然科学研究项目(07KJB520057)
- 作品数:3 被引量:12H指数:2
- 相关作者:周俊生陈家骏徐谦别致刘未鹏更多>>
- 相关机构:南京师范大学南京大学更多>>
- 发文基金:江苏省高校自然科学研究项目国家自然科学基金国家社会科学基金更多>>
- 相关领域:自动化与计算机技术环境科学与工程更多>>
- Dirichlet过程及其在自然语言处理中的应用被引量:9
- 2009年
- Dirichlet过程是一种典型的变参数贝叶斯模型,其优点是参数的个数和性质灵活可变,可通过模型和数据来自主地计算,近年来它已成为机器学习和自然语言处理研究领域中的一个研究热点。该文较为系统的介绍了Dirichlet过程的产生、发展,并重点介绍了其模型计算,同时结合自然语言处理中的具体应用问题进行了详细分析。最后讨论了Dirichlet过程未来的研究方向和发展趋势。
- 徐谦周俊生陈家骏
- 关键词:计算机应用中文信息处理
- 中文共指消解中的聚类全局优化
- 共指消解的主流框架分为二元分类和等价类划分两个步骤,围绕第二个步骤进行的全局优化是主要的研究方向之一。本文结合共指消解问题本身的特点提出了一种基于最小化决策错误的损失函数,并利用一种自底向上的聚类模型对其进行优化,此外提...
- 刘未鹏周俊生黄书剑陈家骏
- 关键词:共指消解全局优化聚类损失函数
- 文献传递
- 基于SVM-Adaboost的中文组块分析被引量:2
- 2008年
- 组块分析是一种非常重要的句法分析预处理手段,通过将文本划分成一组互不重叠的片断,来达到降低句法分析的难度。提出一种基于SVM-Adaboost的中文组块分析方法,将基于线性核函数的支持向量机与Adaboost算法相结合,以基于线性核函数的SVM作为Adaboost的分量分类器,在学习过程中改变分量分类器的核参数。实验结果表明了该算法的有效性。
- 别致周俊生陈家骏
- 关键词:ADABOOST支持向量机
- 基于有监督关联聚类的中文共指消解被引量:1
- 2009年
- 共指消解是文本信息处理中的一个重要问题。提出了一种有监督的关联聚类算法以实现对中文实体提及的共指消解。首先将共指消解过程看成图的关联聚类问题,从全局的角度实现对共指等价类的划分,而不是孤立地对每一对名词短语分别进行共指决策;然后给出了关联聚类的推导算法;最后设计了一种基于梯度下降的特征参数学习算法,使得训练出的特征参数能够较好拟合关联聚类的目标。在ACE中文语料上的实验结果显示,该算法优于传统的"分类-聚类"共指消解学习算法。
- 刘未鹏周俊生黄书剑陈家骏
- 关键词:共指消解损失函数
- 基于一种新的合成核的中文实体关系自动抽取
- 实体关系的抽取是信息抽取中的一个重要问题。针对中文句法分析研究现状,本文首先设计了一种能够直接利用浅层语言特征的混合谱核来描述关系实例的上下文,并给出了基于广义后缀树的高效核计算方法;然后再通过与实体核的组合生成合成核,...
- 周俊生戴新宇陈家骏曲维光
- 关键词:关系抽取广义后缀树