您的位置: 专家智库 > >

宋柔

作品数:95 被引量:376H指数:13
供职机构:北京语言大学信息科学学院更多>>
发文基金:国家自然科学基金国家高技术研究发展计划教育部科学技术研究重点项目更多>>
相关领域:自动化与计算机技术语言文字文化科学理学更多>>

文献类型

  • 55篇期刊文章
  • 36篇会议论文
  • 3篇专利
  • 1篇科技成果

领域

  • 67篇自动化与计算...
  • 18篇语言文字
  • 7篇文化科学
  • 2篇理学
  • 1篇机械工程
  • 1篇电子电信
  • 1篇交通运输工程

主题

  • 22篇汉语
  • 12篇自然语言
  • 11篇信息处理
  • 11篇语言处理
  • 11篇汉字
  • 11篇分词
  • 10篇中文
  • 10篇自然语言处理
  • 9篇语料库
  • 9篇标点
  • 8篇语料
  • 8篇中文信息
  • 8篇中文信息处理
  • 8篇计算机
  • 7篇字形
  • 7篇汉字字形
  • 6篇信息检索
  • 6篇自动分词
  • 6篇现代汉语
  • 6篇百科

机构

  • 83篇北京语言大学
  • 35篇北京工业大学
  • 7篇内蒙古师范大...
  • 4篇北京外国语大...
  • 3篇北京大学
  • 3篇北京信息科技...
  • 3篇广东外语外贸...
  • 2篇中国人民解放...
  • 2篇北京计算机学...
  • 1篇南京师范大学
  • 1篇首都体育学院
  • 1篇中国科学院
  • 1篇香港城市大学
  • 1篇中国电子信息...
  • 1篇科大讯飞股份...

作者

  • 95篇宋柔
  • 12篇罗智勇
  • 10篇尚英
  • 10篇林民
  • 8篇王洁
  • 8篇荀恩东
  • 7篇许勇
  • 6篇卢达威
  • 5篇熊文新
  • 4篇葛诗利
  • 4篇张榕
  • 3篇修驰
  • 3篇王慧玲
  • 3篇蒋玉茹
  • 2篇钱揖丽
  • 2篇刘贵龙
  • 2篇邢富坤
  • 2篇张瑞朋
  • 1篇岳炳词
  • 1篇赵瑾

传媒

  • 16篇中文信息学报
  • 4篇北京工业大学...
  • 4篇计算机工程
  • 4篇计算机工程与...
  • 4篇计算机科学
  • 4篇全国第八届计...
  • 3篇计算机研究与...
  • 2篇当代语言学
  • 2篇计算机工程与...
  • 2篇计算机应用
  • 2篇软件学报
  • 2篇第九届全国计...
  • 2篇全国第八届计...
  • 1篇世界汉语教学
  • 1篇中国语文
  • 1篇模式识别与人...
  • 1篇语言战略研究
  • 1篇计算机应用研...
  • 1篇小型微型计算...
  • 1篇情报学报

年份

  • 1篇2023
  • 1篇2020
  • 1篇2018
  • 1篇2017
  • 2篇2015
  • 6篇2014
  • 2篇2013
  • 2篇2012
  • 3篇2011
  • 4篇2010
  • 3篇2009
  • 8篇2008
  • 13篇2007
  • 8篇2006
  • 13篇2005
  • 7篇2004
  • 3篇2003
  • 3篇2002
  • 6篇2001
  • 1篇1998
95 条 记 录,以下是 1-10
排序方式:
基于CRF的百科全书文本段落划分被引量:4
2007年
CRF模型是标注、切分序列数据的较新的概率模型,在信息抽取等文本处理领域广受关注。该文介绍了CRF方法,并将其应用到百科全书文本段落的划分上,利用CRF的特征表述机制加入了文本单元序列中的长距离约束,取得了比传统的隐马尔科夫方法更好的结果。
许勇宋柔
关键词:条件随机域模型隐马尔科夫模型
广义话题结构理论视角下话题自足句成句性研究被引量:4
2014年
话题自足句是在广义话题结构理论的基础上定义的。话题自足句的成句性是广义话题结构的重要性质之一。该文在38万字不同语体的广义话题结构语料库中对话题自足句的成句性进行了实证性调查,发现有少量话题自足句不成句,对不成句现象进行了分析、分类,并提出了使其成句的办法。这将进一步完善广义话题结构理论,并能提高使用话题自足句的应用系统的性能。
尚英宋柔卢达威
藏族人名汉译名识别研究被引量:3
2009年
藏族人名汉译名识别属于人名识别的范畴,但现有的人名识别方法并不能完全切合藏族人名命名特点:藏族人名具有浓厚的宗教文化内涵,字(串)特征和内部构成复杂 其次,藏族人名中含有大量高频单字,使得藏族人名和普通词语之间歧义冲突变得十分突出,同时也使得藏族人名和上下文之间的边界变得非常模糊。本文在大规模藏族人名实例和语料库调查基础上,统计分析了藏族人名的用字(串)特征,并构建了藏族人名属性特征库 通过藏族人名的命名规则及属性特征将藏族人名形式化表示,实现了藏族人名汉译名自动识别系统。真实语料库开放测试F值达到87.12%。
罗镭贾宋柔朱小杰
关键词:未登录词自动分词
汉语专名的初步研究
专名对于自然语言处理有重要意义.本文对专名进行了界定,提出了汉语专名的特点,讨论了这些特点在信息量表示、词语聚类、专名识别方面的应用.
宋柔邹嘉彦
文献传递
信息检索需求描述中的词语区域凸显
2008年
根据对当前主流信息检索测试Query的形式和内容分析,通过正则表达式将SGML形式的Query表述区分为不同描述域和主题功能块,针对处于不同区域的词语实施不同的加权策略。实验表明,结合主题词语的区域凸显和TF×IDF的加权方法比单纯TF×IDF方法MRR值高出26.67%。
熊文新宋柔
关键词:信息检索功能块
汉字字形计算及其在校对系统中的应用被引量:5
2008年
汉语是一种开放大字符集语言,汉字字形相似度计算是汉语信息处理的一项基础研究,对于汉字识别、计算机辅助的汉语文章校对和汉字教学都有重要作用.本文对现有汉字字形结构描述方法从图形相似角度进行了改进,并给出了一种基于结构描述的字形相似度计算算法,该方法计算相似度无需字形样本实例的学习训练,对于常用字和难于获取书写样本的生僻字的相似度计算,都具有很好的适应性,可满足不断扩大的汉字集合计算相似度的需要.实验表明,采用此法计算得到的GB2312中6763个汉字的相似字表,与人的认知结果吻合度很好,并应用于计算机辅助校对系统中的别字修改提示,显示出较好效果.
宋柔林民葛诗利
关键词:汉字字形相似度
从广义话题结构考察汉语篇章话题认知复杂度被引量:10
2014年
语言理解问题从认知的角度已有大量的研究,但针对汉语的研究却很少。由于认知实验操作复杂,不容易大规模复制,因此难以量化其结论的普遍性以及对语言事实的覆盖度。该文尝试模拟人补足汉语篇章片段中话题-说明信息的过程,建立广义话题结构认知机模型,并通过认知机对大规模汉语语料进行定量分析,考察汉语标点句的话题认知所需的记忆资源及认知局限性。用作统计特征量的广义话题结构特征有标点句的深度、话题结构内折返度、话题栈深度、话题栈折返度、搁置区使用量。统计数据可从认知行为的视角得到合理解释。该文一方面揭示了说汉语者的话题认知能力的表现和局限性,另一方面又说明了广义话题结构认知机是话题认知的合理模型。
卢达威宋柔尚英
关键词:汉语篇章
基于互联网的汉语术语定义提取研究
本文的术语定义抽取,在分析术语定义的语言学特征,进行硬匹配的基础上,通过将术语定义用词与人民日报用词进行对比,给出了词语和句子的定义隶属度这一概念,并且与向量空间模型有效结合起来,提出了一种术语智能匹配算法.实验取得了较...
张榕宋柔
关键词:汉语互联网
文献传递网络资源链接
相似词及其在计算机辅助校对系统中的应用
统计方法在自然语言处理的多种应用中取得了令人瞩目的成果,但数据稀疏问题限制了应用系统性能的提高。把统计单位由词提升到词类有助于缓解数据稀疏问题,但是传统的词类体系并不能反映词语在线性邻接(ngram)特征上的相似关系,而...
罗智勇宋柔
关键词:数据稀疏相似词计算机辅助校对
文献传递
基于互连网的术语定义获取系统被引量:21
2004年
文中介绍了一个实验性的基于互联网的术语定义获取系统 ,可以方便、迅速的从互连网上查找术语的定义以及与定义有关的内容 ,给用户迅速获得新生术语以及新技术词汇的定义方面的知识提供方便。系统采用一组术语定义的语言学模式 ,以多线程方式高效下载网页 ,并从中匹配符合术语定义模式的文本段落 ,再经一定后续处理 ,形成返回给用户的结果。系统中使用的语言学模式是在一定量的科技期刊语料库中获取的。试验结果表明系统的运行效率高 。
许勇荀恩东贾爱平宋柔
关键词:人工智能自然语言处理信息抽取
共10页<12345678910>
聚类工具0