刘洪超
- 作品数:5 被引量:9H指数:2
- 供职机构:香港理工大学更多>>
- 发文基金:国家社会科学基金更多>>
- 相关领域:自动化与计算机技术语言文字电子电信更多>>
- 基于语言学特征向量和词嵌入向量的汉语动词事件类型预测
- 本文主要介绍汉语动词事件类型的预测.事件类型是根据内部时间结构对汉语动词进行的重要分类,包括状态、活动、变化(完结和达成).对汉语动词事件类型进行预测从理论上能够对以往语言学研究提出的特征进行验证,从应用上可以服务于机器...
- 刘洪超黄居仁侯仁魁李洪政
- 关键词:汉语动词语言学特征
- 现代汉语通感的自动抽取及映射方向性
- 本文主要介绍现代汉语中通感(synaesthesia)句子的自动抽取和感觉域之间的映射规律.本文所采取的方法视是通过构建各个感觉领域的词表和词性匹配的方式抽取语料库中的通感句子.本文前后采取了两种方法,一种是单纯的多领域...
- 刘洪超黄居仁
- 关键词:现代汉语通感自动抽取
- 基于语言学特征向量和词嵌入向量的汉语动词事件类型预测被引量:2
- 2018年
- 该文主要介绍汉语动词事件类型的预测。事件类型是根据内部时间结构对汉语动词进行的重要分类,包括状态、活动、变化(完结和达成)。对汉语动词事件类型进行预测从理论上能够对以往语言学研究提出的特征进行验证,从应用上可以服务于机器翻译等任务。该文基于两种方式构建词向量进行汉语动词事件类型的预测,一种是根据语言学特征有监督地构建词向量,另一种是利用word2vec无监督地构建词嵌入向量。通过多元逻辑回归、支持向量机和人工神经网络分类器对汉语动词事件类型进行预测,最终实现了73.6%的总体准确率。
- 刘洪超黄居仁侯仁魁侯仁魁
- 关键词:汉语动词语言学特征
- 基于语料库的汉语字母词自动抽取与分析被引量:4
- 2017年
- 本文为汉语字母词研究提出新视角。首先,我们实现了基于语料库的汉语字母词自动抽取和计量分析。其次,我们在理论上澄清了汉语字母词中的字母并非拼音字母(letter),而是书写字母(alphabet)。同时从音韵、构词与书写系统理论出发,进一步分析了汉语字母词对现有语言学理论的挑战及字母词分析对语言本体研究可能具有的重大贡献。基于对组字字母K的分析,我们主张组字字母的语言行为与汉字类似,而与拼音字母有很大的差距。最后,本文强调字母词的研究是语言科技对语言生活影响的一个重大课题。
- 黄居仁刘洪超
- 关键词:汉语字母词语料库语言学
- 现代汉语通感的自动抽取及映射方向性被引量:3
- 2015年
- 主要介绍现代汉语中通感(Synaesthesia)句子的自动抽取和感觉域之间的映射规律。通过构建各个感觉领域的词表和词性匹配的方式抽取语料库中的通感句子,采取了两种方法,一种是单纯的多领域感觉词匹配,准确率为20.78%;第二种方法加入了词性匹配,准确率为46.37%。主要难点在于五种感觉领域词表中词的选取和收集以及词性分布规则的总结上。最后统计了抽取句子通感源域到目标域的映射情况,检查了其映射方向是否与其他语言相同。
- 刘洪超Francesca Striklievers黄居仁
- 关键词:现代汉语通感自动抽取