您的位置: 专家智库 > >

朱朝勇

作品数:3 被引量:48H指数:3
供职机构:中国科学技术大学更多>>
发文基金:国家自然科学基金国家高技术研究发展计划更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 2篇期刊文章
  • 1篇学位论文

领域

  • 3篇自动化与计算...

主题

  • 1篇登录
  • 1篇知识库
  • 1篇散列
  • 1篇散列表
  • 1篇时间复杂度
  • 1篇中文
  • 1篇中文字
  • 1篇中文字符
  • 1篇中文字符串
  • 1篇字符
  • 1篇字符串
  • 1篇未登录词
  • 1篇文本分类
  • 1篇新词识别
  • 1篇基于本体
  • 1篇复杂度
  • 1篇概念化
  • 1篇本体
  • 1篇层次化

机构

  • 3篇中国科学技术...
  • 2篇中国科学院
  • 2篇新疆师范大学

作者

  • 3篇朱朝勇
  • 2篇张海军
  • 1篇史树敏
  • 1篇黄河燕
  • 1篇丁溪源

传媒

  • 1篇计算机工程与...
  • 1篇计算机科学

年份

  • 1篇2013
  • 2篇2010
3 条 记 录,以下是 1-3
排序方式:
基于本体的知识库分类研究
语言知识库是自然语言处理的基础资源,知识库中知识的丰富程度、知识表示形式以及知识的组织方式直接关系到基于知识库的自然语言处理应用的性能。   现有基于领域分类的知识库大多是在以人为对象的词典基础之上建立起来的,知识的覆...
朱朝勇
关键词:本体知识库文本分类概念化
一种改进的中文字符串排序方法被引量:3
2010年
对中文字符串排序,最快算法的时间复杂度是O(nlgn)。基数排序算法是目前最快的排序方法之一,时间复杂度是O(dn),但其一般适用于相同长度的整型数据排序。提出了一种快速的变换方法,将字符串转换为与之等长的整型数组,使用基数排序算法对代表字串的整型数组排序,用以实现对字符串的快速排序。实验表明,提出的算法能快速地进行中文字符串排序,比快速排序算法具有更好的性能,且排序时间与数据规模之间是线性关系,算法的时间复杂度为O(dn)。
张海军丁溪源朱朝勇
关键词:中文字符串散列表时间复杂度
中文新词识别技术综述被引量:42
2010年
新词识别是中文信息处理领域的关键技术。新词识别主要包括候选字串的提取过滤和词性猜测两项任务。中文没有特定符号标志词边界,因此任何相邻字符都有成词的可能性,这给新词提取过滤带来了很大困难;由于没有先验知识和统计数据,新词词性猜测一直是中文词性标注的技术瓶颈。详细分析了中文新词识别技术的研究现状,重点讨论了候选新词提取和词性猜测的研究方法与存在的主要问题,最后对新词识别研究方向进行了展望。
张海军史树敏朱朝勇黄河燕
关键词:新词识别未登录词
共1页<1>
聚类工具0