王若兰
- 作品数:4 被引量:2H指数:1
- 供职机构:昆明理工大学更多>>
- 发文基金:云南省自然科学基金国家自然科学基金更多>>
- 相关领域:自动化与计算机技术语言文字更多>>
- 基于马尔科夫逻辑网的柬埔寨语复杂组织机构名识别
- 随着我国与柬埔寨国家的交流合作日益频繁,进行柬埔寨的自然语言处理工作变得尤为重要。由于不同语言之间存在较大的差异,因此,其他语言的命名实体识别方法无法直接移植到柬埔寨语中。为了提高柬埔寨语组织机构名识别的准确率,本文围绕...
- 王若兰
- 关键词:柬埔寨语TRI-TRAINING一阶逻辑
- 文献传递
- 基于Tri-training的柬埔寨语组织机构名识别被引量:1
- 2018年
- 随着我国与柬埔寨的交流合作日益频繁,柬埔寨语的自然语言处理工作变得更为重要,针对柬埔寨语语料库资源有限、柬埔寨语组织机构名标注语料稀缺的问题,提出了一种基于半监督Tri-training的柬埔寨语组织机构名识别方法。该方法利用改进的Tri-training算法,结合柬埔寨语的语言特点进行实验。实验结果显示,准确率和召回率分别达到了65.68%、67.83%,表明该方法能有效利用大量未标注语料得到准确率较高的标注语料。
- 谢俊严馨王若兰周枫李思远
- 关键词:半监督学习
- 一种柬埔寨语组织机构名识别方法
- 本发明涉及一种柬埔寨语组织机构名识别方法,属于自然语言处理技术领域。本发明首先对抽取的柬埔寨语篇章进行切分,切分后的句子进行分词和词性标注,通过人工校对,然后标注柬埔寨语命名实体,得到相当规模的柬埔寨语组织机构名语料;通...
- 严馨王若兰余正涛郭剑毅
- 文献传递