火善栋
- 作品数:19 被引量:23H指数:2
- 供职机构:重庆三峡学院计算机科学与工程学院更多>>
- 发文基金:重庆市科技计划项目更多>>
- 相关领域:自动化与计算机技术文化科学自然科学总论更多>>
- 用哈希算法和二分法实现中文词典的快速查找
- 2014年
- 分词词典是汉语自动分词系统中的一个基本组成部分,其查询速度直接影响到分词系统的处理速度。文章提出并实现了一种用哈希算法和二分查找算法相结合的中文单词查找算法,实验显示,该算法可以实现对字符串的快速查找。
- 火善栋
- 关键词:词典分词哈希算法
- 有限状态机在中文文本分词中的应用被引量:1
- 2010年
- 提出并实现一种有限状态机算法,该方法结合二分查找树算法将整个词典构造成一个有限状态机,从而使词典中的每个不同的汉字以不同弧权值的形式存在于有限状态机中。当要判断某个字符串是不是词时,只要从这个有限状态机的第一个状态结点依次进行查找即可。实验显示,通过这个有限状态机词典可以实现对字符串的快速查找。
- 火善栋
- 关键词:中文信息处理有限状态机汉语分词
- 采用CNN进行中文文本分类被引量:1
- 2023年
- 通过卷积神经网络,运用两种不同的方案对中文文本分类进行了对比实验,实验结果表明,对于中文文本分类问题,仅采用CNN中的全连接层并选择合适的特征词和激活函数就可以达到比较理想的分类效果。
- 火善栋
- 关键词:卷积神经网络中文文本分类特征词激活函数
- 通过汇编语言理解函数调用的内在机理被引量:4
- 2010年
- 汇编语言是一种面向计算机硬件的符号化的机器语言,通过对汇编语言的学习可以加深对计算机内部原理的理解。文章借助汇编语言详细分析了高级语言中计算机实现函数调用的一些技术细节,包括调用过程中计算机做了哪些具体动作。实践表明,借助汇编语言有助于理解函数调用和堆栈的关系以及函数调用的内在机理,进而加深对一些相关算法和高级语言的理解。
- 火善栋
- 关键词:汇编语言函数调用堆栈
- 用汇编语言解析C++中类和对象各成员内存结构特点
- 2014年
- 汇编语言是面向计算机硬件的符号化的机器语言,通过学习汇编语言可以加深对计算机内部原理以及高级编程语言的理解。借助汇编语言低级化的特点,通过一个简单的C++小程序和其对应的反汇编代码,从汇编语言的角度详细地分析和展示C++中类和对象各成员在内存中的分布特点,从而帮助读者从本质上理解类、对象、成员变量和成员函数之间的各种关系。
- 火善栋
- 关键词:汇编语言成员函数内存
- Java匿名类的分析和理解
- 2011年
- 针对一些Java学习者对匿名类经常产生模糊认识,通过三个具体的实例详细地分析了Java匿名类的内在本质。分析结果表明,匿名类实际上可以看作是一个类的子类或者是一个接口的实现类,这样可使匿名类更易于理解。
- 火善栋杨旭东
- 关键词:JAVA子类接口
- 用AdaBooster算法实现中文文本分类问题
- 2016年
- 文本分类是文本挖掘的一个重要内容,在很多方面都有着广泛的应用。为了实现中文文本分类问题,先采用分词技术和特征词统计相关方法得到每类训练文档的特征向量中心(质心),通过比较测试文档到质心的距离来实现中文文档分类,然后采用AdaBooster算法通过不断调整每类训练文档的质心构建一个强分类器。实验表明:采用AdaBooster算法进行中文文本分类时,算法简单、分类速度快、正确率高、占用内存小而且可以根据训练文档的不同实时地调整迭代次数。
- 火善栋
- 关键词:中文文本分类ADA中文分词
- 基于XML的Deep Web信息抽取系统的研究与初步实现
- 随着互联网的迅猛发展,越来越多的信息在网上发布,这给人们查询信息带来巨大便利的同时,也使得人们面对大量的信息不知所措,寻找一条自己想要的信息变得异常困难。为了更好的利用互联网资源,就必须从各种各样不同的网站上将相关的信息...
- 火善栋
- 关键词:信息抽取XMLXSLT
- 文献传递
- 用汇编语言剖析递归算法的内在机理被引量:1
- 2012年
- 汇编语言是一门面向计算机硬件的符号化的机器语言,通过对汇编语言的学习可以加深对计算机内部原理的理解.文章借助汇编语言低级化的特点,详细地分析了递归算法的内在运行机理.
- 火善栋杨旭东
- 关键词:汇编语言递归算法堆栈
- FORM表单反馈网页信息抽取的研究与实现
- 2009年
- 实现了以table标记为信息存贮特点的多记录网页信息的自动抽取工作,该抽取方法从网页信息的存贮特点入手,将有用信息定位于表格中,该抽取方法能够在一个网页中自动查找结构相同或相似的记录模式,并自动分析该记录模式的结构特点从而调用相应的抽取模式(XSLT文档)实现对信息的自动抽取。
- 火善栋
- 关键词:信息抽取网页