国家社会科学基金(04BYY009)
- 作品数:5 被引量:61H指数:3
- 相关作者:苏新春李安洪桂治更多>>
- 相关机构:厦门大学山东大学更多>>
- 发文基金:国家社会科学基金更多>>
- 相关领域:语言文字自动化与计算机技术更多>>
- 国家语委“通用语料库·核心库”的词表提取及词汇构成分析被引量:5
- 2007年
- 在真实语料中提取词表面临着许多技术与理论上的难点与困难,但它又有着特殊的价值。“通用语料库”是国家语委组织研制的大型语料库,基本反映了现代汉语的语言面貌,完成对它的词表提取,其过程、做法及词表结果,都有着重要意义。机器分词时会遇到分词的正确性、加工精度的可容性、机器分词的强制性、机器分词的局限性等问题。源于真实语料的词表清楚反映出断代词汇由语言词和言语词两个层面构成,两个层面的词语之间有着互渗作用。源于真实语料的词表存在着书面语与口语的差异,不规范现象也较普遍存在,在词语的普遍性上与断代词汇有着相当的距离。
- 苏新春
- 关键词:词表
- 对外汉语词汇大纲与两种教材词汇状况的对比研究
- 本文从词汇计量研究的手段入手,着力探讨不同目的下进行的词汇计量和词表制作对对外汉语教材编写的影响。纵观词汇计量研究和词表制作的历时态势和异同,横看教材编写的词汇现状差异,以便能够对北大版和北语版两种具有代表性教材的词汇状...
- 苏新春
- 关键词:教材词汇
- 文献传递
- 对外汉语词汇大纲与两种教材词汇状况的对比研究被引量:47
- 2006年
- 本文从词汇计量研究的手段入手,着力探讨不同目的下进行的词汇计量和词表制作对对外汉语教材编写的影响。纵观词汇计量研究和词表制作的历时态势和异同,横看教材编写的词汇现状差异,以便能够对北大版和北语版两种具有代表性教材的词汇状况作出客观而细致的描写。通过对对外汉语纲领性质的词汇大纲和《现代汉语频率词典》的对比,进而探讨两种教材词汇收录和分布的差异及其形成原因,最终探寻能够解决教材收录和分布词汇时出现的种种问题之对策和方法,以期能够对对外汉语教材的编写提供有价值的意见和建议。
- 苏新春
- 关键词:教材词汇对外汉语教材语言研究
- 机用义项库在词义标注中的作用及其完善被引量:9
- 2010年
- 计算机词义标注一般都沿用传统词典的义项,随着研究的深入,对传统词典义项的设立提出了新的要求。有学者提出了以句法功能为主要依据来辨析义项。我们的研究注重词义语义特征的提取,共建构了七个资源库,互相之间主要围绕着词义语义特征展开,义项库在计算机词义标注中居于关键位置。机用义项库与传统词典义项相比,在词义标注目的、对语料的覆盖力、义项间语义关系、义项的可识别性、计算机处理能力的适应性及不同属性的义项义频的差距等方面,都存在着相当大的差别。从而,可以对基于传统词典义项上形成的机用义库提出改造与完善的若干原则与方法。
- 苏新春李安洪桂治
- 关键词:词义标注
- 多义词词义搭配知识库与词义标注被引量:1
- 2014年
- "多义词词义搭配知识库与词义标注"是国家社科基金课题"基于国家语委‘通用语料库’的汉语义频词库的开发"的研究成果。研究过程中对最初设计的目标定位、处理的词语数量、语料规模都作了较大调整,表现为由义频研究转至义频获得,由部分多义词转至现代汉语的整体双音高频多义词,由2000万字的核心语料库转至2.5亿字的通用语料库。研究成果由7个资源库与3个软件处理平台构成,从而达到词义自动标注的目的。
- 苏新春
- 关键词:多义词SCT
- 对义项设立是否贴切的一种检验方法——词义标注对词典编纂的一点启示被引量:1
- 2012年
- 文章根据词义标注的实践设计了一种检验词典义项设立是否贴切的方法,包括建立大规模平衡语料库,随机抽取一定规模语料作为检验库,对抽检语料做完全标注三个步骤。通过该检验方法能发现现有词典义项设立中存在的若干问题。
- 李安
- 关键词:词典释义词义标注