周文翠
- 作品数:2 被引量:25H指数:2
- 供职机构:南京大学计算机科学与技术系计算机软件新技术国家重点实验室更多>>
- 发文基金:国家科技基础条件平台建设计划国家高技术研究发展计划国家自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 并列复句的自动识别初探被引量:12
- 2008年
- 从《人民日报》语料库中抽取4万多个句子作为训练集和测试集,选取其主语、谓语等相关特征并根据《知网》将特征量化,然后使用支持向量机进行训练,获取判别并列复句的模型。在开放测试中获得了84%的准确率。
- 周文翠袁春风
- 关键词:并列复句知网支持向量机
- 基于标点符号分割的汉语句法分析算法被引量:13
- 2007年
- 目前大部分句法解析器都忽略标点符号这一重要的句法特征或者只进行非常简单的处理。本文根据标点符号的句法结构特性,提出单独解析块的概念,并且根据标点符号在句子中的特有特征和位置关系,给出了基于决策树算法(Id3)单独解析块识别方法,将标点融入汉语句法分析中。本文所用的实验数据(包括训练集和测试集)均来自中文宾州树库5.0。对句长大于40个词的汉语长句单独进行了实验,句法分析精度和召回率分别提高1.59%和0.93%,同时时间开销降低了近2/3。实验结果表明,标点对汉语长句句法分析非常有利,系统性能获得了较大提高。
- 毛奇连乐新周文翠袁春风
- 关键词:计算机应用中文信息处理