朱朝勇
- 作品数:3 被引量:48H指数:3
- 供职机构:中国科学技术大学更多>>
- 发文基金:国家自然科学基金国家高技术研究发展计划更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于本体的知识库分类研究
- 语言知识库是自然语言处理的基础资源,知识库中知识的丰富程度、知识表示形式以及知识的组织方式直接关系到基于知识库的自然语言处理应用的性能。
现有基于领域分类的知识库大多是在以人为对象的词典基础之上建立起来的,知识的覆...
- 朱朝勇
- 关键词:本体知识库文本分类概念化
- 一种改进的中文字符串排序方法被引量:3
- 2010年
- 对中文字符串排序,最快算法的时间复杂度是O(nlgn)。基数排序算法是目前最快的排序方法之一,时间复杂度是O(dn),但其一般适用于相同长度的整型数据排序。提出了一种快速的变换方法,将字符串转换为与之等长的整型数组,使用基数排序算法对代表字串的整型数组排序,用以实现对字符串的快速排序。实验表明,提出的算法能快速地进行中文字符串排序,比快速排序算法具有更好的性能,且排序时间与数据规模之间是线性关系,算法的时间复杂度为O(dn)。
- 张海军丁溪源朱朝勇
- 关键词:中文字符串散列表时间复杂度
- 中文新词识别技术综述被引量:42
- 2010年
- 新词识别是中文信息处理领域的关键技术。新词识别主要包括候选字串的提取过滤和词性猜测两项任务。中文没有特定符号标志词边界,因此任何相邻字符都有成词的可能性,这给新词提取过滤带来了很大困难;由于没有先验知识和统计数据,新词词性猜测一直是中文词性标注的技术瓶颈。详细分析了中文新词识别技术的研究现状,重点讨论了候选新词提取和词性猜测的研究方法与存在的主要问题,最后对新词识别研究方向进行了展望。
- 张海军史树敏朱朝勇黄河燕
- 关键词:新词识别未登录词