贾时银
- 作品数:5 被引量:38H指数:3
- 供职机构:云南大学信息学院更多>>
- 发文基金:云南省自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于字分类的中文分词的研究被引量:10
- 2011年
- 中文分词是自然语言处理的前提和基础,利用基于字分类的方法实现中文分词,就是将中文分词想象成字分类的过程。把字放入向前向后相邻两个字这样的一个语境下根据互信息统计将字分成四种类别,即跟它前面结合的字,跟它后面结合的字,跟它前后结合的字,独立的字。在分词的过程中采用了t-测试算法,一定程度上解决了歧义问题。以人民日报为语料库进行训练和测试,实验结果表明,该方法能够很好地处理歧义问题,分词的正确率达到了90.3%,有了明显的提高。
- 韩月阳邓世昆贾时银李远方
- 关键词:中文分词互信息
- 一种改进的最大匹配中文分词算法被引量:16
- 2011年
- 最大匹配算法包括正向最大匹配和逆向最大匹配两种算法,是中文分词领域的基础性算法,目前被广泛应用于众多领域。文中在详细分析了最大匹配算法的优缺点的基础上,提出了一种改进的最大匹配分词算法。改进算法在分词前先对词库进行了规范化预处理,分词时由汉字检索到该字开头的词组,再按词组长度由长到短的顺序使用传统最大匹配算法检索词库。目的是解决传统方法匹配效率低下和不能切分长词的问题。经算法分析结果表明,改进的算法较传统的最大匹配算法高效,分词能力更强。
- 闻玉彪贾时银邓世昆李远方
- 关键词:索引词库分词
- 脉冲耦合神经网络在图像分割与图像检索中的应用研究
- 脉冲耦合神经网络PCNN(Pulse Coupled Neural Networkl是一种有着严格生物学背景的且不同于传统人工神经网络的第三代人工神经网络。与传统的人工神经网络相比,PCNN具有阈值动态可变的特性,双通道...
- 贾时银
- 关键词:脉冲耦合神经网络图像分割图像检索各向异性扩散遗传算法
- 脉冲耦合神经网络模型参数优化及图像分割被引量:3
- 2010年
- 脉冲耦合神经网络在图像处理中有着重要应用,但存在模型参数难以选择和图像边缘过于平滑问题.通过对图像进行双线性插值运算,再利用具有保护图像边缘作用的各向异性扩散特性确定模型的链接权值参数,采用遗传算法求解模型的链接强度参数和衰减阈值参数,成功实现了图像的自动分割.仿真结果表明,该方法得到的图像分割结果,体现了更多的图像轮廓和边缘细节,具有较好计算性能.
- 贾时银周冬明聂仁灿赵东风
- 关键词:脉冲耦合神经网络图像分割双线性插值遗传算法各向异性扩散
- 基于树结构的MapReduce模型被引量:9
- 2011年
- MapReduce是Google开发的一种并行分布式计算模型,已在搜索和处理海量数据领域得到了广泛的应用。此模型只适用于数据关联性弱、能够高度并行化的程序,未能处理数据关联性强的数据(比如树形结构)。文中详细讨论了MapReduce的实现机制,提出了一种基于树结构的MapReduce模型,它是基于一种聚类聚合的反复轮询过程,聚合时用代替传统的,使模型更具有一般性。最后搭建Hadoop平台来处理XML结构的海量数据,并比对新旧两种模型的效率。实验结果表明,其执行速度明显比传统模型高效。
- 李远方贾时银邓世昆韩月阳
- 关键词:树结构MAPREDUCEXMLHADOOP