山西省科技攻关计划项目(200703112601)
- 作品数:1 被引量:8H指数:1
- 相关作者:王瑞波李济洪李国臣更多>>
- 相关机构:山西大学更多>>
- 发文基金:山西省科技攻关计划项目国家自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于条件随机场模型的汉语功能块自动标注被引量:8
- 2010年
- 汉语组块分析是将汉语句子中的词首先组合成基本块,进一步组合形成句子的功能块,最终形成一个具有层次组合结构的汉语句法描述结构.将汉语功能块的自动标注问题看作序列标注任务,并使用词和基本块作为标注单元分别建立标注模型.针对不同的标注模型,分别构建基本块层面的特征集合,并使用条件随机场模型进行汉语功能块的自动标注.实验数据来自清华大学TCT语料库,并且按照8∶2的比例切分形成训练集和测试集.实验结果表明,与仅使用词层面信息的标注模型相比,基本块特征信息的适当加入可以显著提高功能块标注性能.当使用人工标注的基本块信息时,汉语功能块自动标注的准确率达到88.47%,召回率达到89.93%,F值达到89.19%.当使用自动标注的基本块信息时,汉语功能块的标注的准确率为84.27%,召回率为85.57%,F值为84.92%.
- 李国臣王瑞波李济洪
- 关键词:条件随机场模型句法分析