您的位置: 专家智库 > >

徐润华

作品数:16 被引量:52H指数:4
供职机构:金陵科技学院更多>>
发文基金:国家社会科学基金国家自然科学基金国家教育部“211”工程更多>>
相关领域:自动化与计算机技术语言文字文化科学文学更多>>

文献类型

  • 13篇期刊文章
  • 2篇学位论文

领域

  • 8篇自动化与计算...
  • 6篇语言文字
  • 3篇文化科学
  • 1篇文学

主题

  • 4篇先秦
  • 3篇四字格
  • 3篇句法
  • 3篇搭配
  • 2篇对齐
  • 2篇切分
  • 2篇注疏
  • 2篇自动对齐
  • 2篇左传
  • 2篇先秦文献
  • 2篇句法分析
  • 2篇《左传》
  • 2篇词语
  • 2篇词语搭配
  • 1篇典籍
  • 1篇信息处理
  • 1篇英汉
  • 1篇英汉平行语料...
  • 1篇英汉双语
  • 1篇语料

机构

  • 11篇南京师范大学
  • 9篇金陵科技学院
  • 5篇南京农业大学
  • 1篇南京中医药大...
  • 1篇南通大学

作者

  • 15篇徐润华
  • 5篇王东波
  • 5篇陈小荷
  • 3篇梁社会
  • 2篇李斌
  • 1篇曲维光
  • 1篇许超
  • 1篇冯敏萱
  • 1篇黄爱玲
  • 1篇顾成伟

传媒

  • 2篇计算机工程与...
  • 2篇中文信息学报
  • 2篇西南民族大学...
  • 2篇金陵科技学院...
  • 1篇图书情报工作
  • 1篇图书馆论坛
  • 1篇湖州师范学院...
  • 1篇南京师范大学...
  • 1篇常熟理工学院...

年份

  • 1篇2022
  • 2篇2021
  • 2篇2020
  • 1篇2019
  • 1篇2017
  • 1篇2014
  • 2篇2013
  • 1篇2012
  • 2篇2011
  • 1篇2010
  • 1篇2009
16 条 记 录,以下是 1-10
排序方式:
分词语料库中四字格的切分和识别研究
四字格的能产性和派生性极强,利用四字格模式创造出的新词数量在现代汉语词汇中仍然呈上升趋势,因此对四字格的研究不能仅仅局限于文献和理论。本文将研究的目光投向分词语料库中数量众多的四字格,并针对分词语料库中四字格易被切碎的特...
徐润华
关键词:四字格
文献传递
基于注疏的先秦文献信息处理探索
2020年
先秦文献是我国历史长河中的文化瑰宝,对其进行信息处理有着重要的社会意义。先秦文献信息处理是中文信息处理的一个分支,但先秦文献规模较小,现代汉语的信息处理模式并不能较好地适用于先秦文献。先秦文献的一个显著特点是,历代学者对其进行了深入的解读和细致的加工,形成了一系列的先秦注疏文献。注疏文献中包含了大量先秦文献的词汇及语法知识,通过对多本先秦注疏文献进行统计,论证了利用注疏文献对先秦文献进行信息处理的可行性;并在此基础之上,进一步研究了先秦文献的词语知识获取和命名实体知识获取。
梁社会徐润华
关键词:先秦文献信息处理
基于词语搭配知识和语法功能匹配的句法分析器
句法分析技术是信息处理领域的核心技术之一,也是难点所在。本文认为,词语搭配和句法结构之间有着密切的联系,将词语搭配知识加入到句法分析过程中有助于句法分析精度的提高。本文以词语搭配库和句法分析器互建的思想为指导,在研究中引...
徐润华
关键词:词语搭配知识库句法分析横向评测
文献传递
树库中双词搭配的自动获取和识别研究
2011年
大规模语料中的搭配自动获取和识别技术是自然语言处理领域的基础性工作之一。句子中的搭配和句法结构密切相关,从句法对搭配进行约束的角度,分别提出了一种保留结构中心词的搭配获取方法和一种添加了句法规则约束的搭配识别方法。实验结果表明,保留结构中心词的搭配获取方法能够较为有效地从树库中抽取搭配;添加了句法规则约束的搭配识别方法较之简单查表的搭配识别方法有10%~15%的效果提升。
徐润华冯敏萱陈小荷
关键词:句法结构
多语料库中汉语四字格的切分和识别研究被引量:3
2013年
汉语四字格的能产性和派生性极强,利用四字格模式创造出的新词数量在现代汉语词汇中一直呈上升趋势。该文将研究的目光投向分词语料库中的四字格,对语料库中的四字格进行了系统的分类和归纳,并对语料库内部和语料库之间的四字格切分不一致现象进行了详细的调查统计。最后,针对四字格的切分不一致数据引入条件随机场(CRF)模型,对多语料库中的汉语四字格进行识别实验,封闭测试和开放测试的识别精度均达到93%以上。
徐润华曲维光陈小荷王东波
关键词:四字格CRF模型
一种利用注疏的《左传》分词新方法被引量:18
2012年
先秦文献的注疏文献中包含有大量词汇语义知识,是先秦文献自动分词的重要依据。该文以篇幅最大的先秦文献《左传》为研究对象,在对《左传》及其注疏文献进行自动对齐的基础上,提出了一种利用注疏的《左传》分词新方法。分词实验的F值达到89.0%,较之baseline有明显提升。该方法无需训练语料,利用注疏文献辅助分词的思想也适合推广到其他先秦文献的自动分词任务中去。
徐润华陈小荷
关键词:先秦文献自动对齐自动分词
先秦注疏文献的内容分类
2020年
几乎每种先秦文献都有非常丰富的注疏文献,这些注疏文献可以转化为结构化的形式加以利用,为先秦文献的信息处理服务。选取了25种先秦文献的注疏文献,提出了先秦注疏文献的格式范式,并在此基础上对注疏文献中的引文和注以及注和疏进行了分离,从而完成了对注疏文献内容的分类工作。通过实例表明,注疏文献的分类效果较为理想。
徐润华梁社会
关键词:范式
中国文学国家社会科学基金项目统计分析研究被引量:5
2017年
本文重点关注中国文学领域的国家社科项目,并以国家社会科学基金资助项目名单(1991-2014)和CNKI期刊全文数据库中获得的关于中国文学国家社科项目的相关数据为主要依据,对中国文学国家社科项目基本信息、中国文学国家社科项目标题、中国文学国家社科项目结项情况、中国文学国家社科项目学术研究成果四个方面以及各自具体子内容进行了详尽的统计分析,反映出近年来中国文学领域国家社科项目的一些基本信息、分布特点以及发展趋势。本文研究成果构成了近年来中国文学国家社科项目的大体框架。
徐润华王东波
关键词:文学统计分析
《左传》及其注疏文献的内容自动对齐研究被引量:2
2019年
自动对齐的目的是将半结构化的注疏文献转化为结构化形式,从而为先秦文献的信息处理提供可靠的帮助。探讨《左传》及其注疏文献的三种自动对齐方式:句子对齐、注释对齐和词汇对齐。在句子及注释对齐试验中,对齐的正确率为99.8%,召回率为98.2%,效果较为理想。提出两种词汇对齐的原则,并通过具体实例展示《左传》及其注疏文献的词汇对齐效果。
徐润华梁社会
关键词:句子对齐《左传》
一种面向Web的英汉平行语料库的构建方法被引量:2
2021年
随着自然语言处理领域各项研究的发展,平行语料库作为支撑自然语言处理技术的基础资源,发挥着越来越重要的作用。利用Web中的海量信息资源,采取信息抽取的方法,自动获取英汉双语平行语料资源。在获取过程中,首先确定抓取网站和制定词表,然后利用网络资源抓取工具GUN Wget自动获取网页中的英汉双语句子对资源,在对获得的平行句子对资源进行清洗和去重的基础上,利用条件随机场模型对汉语句子进行自动分词并导入数据库,最终完成大规模英汉双语平行语料库的构建。
徐润华王东波
关键词:平行语料库英汉双语
共2页<12>
聚类工具0