安徽省高校青年教师科研资助计划项目(2007jqw104)
- 作品数:4 被引量:5H指数:2
- 相关作者:丁俊苗更多>>
- 相关机构:巢湖学院陕西师范大学更多>>
- 发文基金:安徽省高校青年教师科研资助计划项目更多>>
- 相关领域:语言文字自动化与计算机技术更多>>
- 基于缩略的词汇生成模式研究被引量:2
- 2009年
- 缩略语的大量产生乃至进一步词化、字化,源于语言现实编码机制的变化和表达时的经济原则,是语言自适应性的一种表现。缩略在汉语词汇生成中具有重要的桥梁和纽带作用,基于缩略的词汇生成模式是:源短语——缩略语——词化——字化——词——短语。这一生成模式的理论背景是汉语的现实编码原则,着力提出和解决的问题是缩略过程中的字化机制以及字化带来的汉字字义演变的新方式。缩略语在新词语中占有越来越大的比重,缩略、字化深刻影响了汉语的字义演变途径和词汇生成模式,给辞书编纂、信息处理中未登录词的自动识别等都提出了新的问题。
- 丁俊苗
- 关键词:缩略语缩略
- 人名、地名、机构名自动识别的形式化策略及意义被引量:1
- 2009年
- 未登录的人名、地名以及机构名的自动识别是中文信息处理中的一个难点,自动识别技术的突破对提高汉语自动切词和句法分析的准确性有很重要的作用。本文基于书面语的特点,在标点符号的启示下,提出一种新的形式化处理策略,即在现代汉语书面语中给人名、地名以及机构名加上专名号,以便于计算机识别,从而通过原始文本的书写改革从根本上彻底解决问题。如能实行,则能一举突破这一难点,召回率和准确率都将能达到100%,而且意义重大,影响深远。
- 丁俊苗
- 现代汉语缩略语自动识别研究的现状与展望被引量:2
- 2008年
- 缩略语自动识别意义重大,有助于提高自动分词和标注的准确率、及时快捷地编写缩略语词典。缩略语自动识别的内容主要有:自动抽取、自动还原、面向中文信息处理的分类体系、缩略语知识库建设等。研究方法上,依托语料库和缩略机制,自觉地把基于规则和统计的方法结合起来。缩略语自动识别研究取得了较大的进展:研究目标明确;进行了一定程度的实验和工程化,识别的准确率和召回率都达到了一定的高度;建立了高质量的缩略语知识库。但也还存在一些问题,研究大都还是初步的,实验的规模也较小,识别的准确率和召回率还不太高,离实用尚有距离。
- 丁俊苗
- 关键词:缩略语未登录词中文信息处理自动识别
- 面向中文信息处理的标点符号研究
- 2008年
- 标点符号是书面语的有机组成部分,使用频率非常高。在中文信息处理中,标点符号有着特殊的意义:它既如同文字一样是中文信息处理的对象,也是计算机识别句法结构信息的重要形式标志。但是,现行标点符号语法功能系统性不强,计算机难于有效利用,因此,需要建设标点符号知识库,统计出标点符号的有关属性;需要与现代汉语语法体系相适应,建立一套以语法为基本原则的独立的标点符号系统,做到标点符号和语法功能一一对应,非语法功能的系统在此基础上二次建立。
- 丁俊苗
- 关键词:中文信息处理标点符号语法