崔荣一
- 作品数:149 被引量:299H指数:8
- 供职机构:延边大学更多>>
- 发文基金:吉林省科技发展计划基金国家自然科学基金吉林省科技厅资助项目更多>>
- 相关领域:自动化与计算机技术文化科学理学更多>>
- 基于改进的蚁群算法的教室管理优化问题被引量:1
- 2014年
- 给出了教室管理问题的一种改进的蚁群优化方法.考虑教室容量、课间距离和单双周课程等因素,对抽象出的数据按优化方向排序,将教室管理问题简化为带权二部图的完备匹配问题;然后运用基于超立方框架的最大最小蚁群算法进行求解.为有效减少搜索空间,该算法按照教室类型对二部图结点进行分块搜索.实验表明,与基本蚁群算法相比,该算法在解决教室管理优化问题上能得到较优解.
- 怀丽波崔荣一赵亚慧
- 关键词:教室管理最大最小蚂蚁系统
- 面向中朝跨语言文本分类的双语主题词嵌入模型的研究
- 日渐丰富的少数民族跨语言文字信息资源,对其进行有效的管理、挖掘与利用有着重要的应用价值.为了解决语言间的差异,解决语言鸿沟问题,针对中朝跨语言文本分类任务,提出了双语主题词嵌入模型.该模型将主题模型与双语词嵌入模型相结合...
- 王琪田明杰崔荣一
- 关键词:主题模型
- 基于N层向量空间模型的文本相似度计算方法被引量:3
- 2016年
- 针对向量空间模型忽略词语出现位置和词序的缺点,结合科技文献结构明显分层的特点,本文提出了基于N层向量空间模型的文本相似度计算方法.该算法首先用N层向量空间模型表示查询短语和科技文献,其次在词频角度上和词序角度上分别计算两者间的相似度,最后得出整体的文本相似度.将本文算法应用于中、朝、英对照科技文献多语种检索模块测试其有效性,测试结果表明,本文设计的文本相似度计算方法算法性能较好,与传统的向量空间模型余弦相似度算法相比,查准率提高了2.7%,MRR提高了2.02%.
- 赵雪崔荣一
- 关键词:向量空间模型词频词序相似度算法
- 基于基本图像特征的中朝文种辨识方法
- 2017年
- 提出了一种基于基本图像特征、适用于不同分辨率自然文本图像的中朝文种辨识方法.在训练阶段,首先构造标准文字图像库,然后提取文字的形态学骨架,最后利用骨架的基本图像特征来训练BP神经网络;在辨识阶段,首先对自然文本图像进行倾斜校正后做二值化处理以提高字符分割的效果,然后进行垂直投影、水平投影、字符分割和提取每个字符的骨架信息,最后基于字符骨架的基本图像特征利用BP神经网络来进行文种辨识.实验表明,本文提出的方法在中朝文种辨识中综合辨识准确率可达到87%.
- 张鹏崔荣一
- 关键词:BP神经网络
- 汉字数学表达式的改进被引量:1
- 2005年
- 汉字笔画中横和竖占很大比例,本文据此分解汉字,提出一种改进的汉字数学表达方法.该方法是以从汉字的整体特征出发进行全局分解得到的基本部件为基本操作数,以部件间的5种位置关系为运算符号的数学表达式.这种表达方式结构简单,形象自然,类似于代数系统,可以按照一定的规则进行运算,并可以广泛地应用于汉字的识别、网络传输、移动通信、汉字结构知识挖掘等方面.
- 吴迪崔荣一金长龙
- 关键词:汉字数学表达式汉字结构
- 基于多粒度表征的朝汉神经机器翻译方法
- 本发明公开了基于多粒度表征的朝汉神经机器翻译方法,包括:采集朝鲜语语料的文本数据并进行预处理,获得语料文本数据的多粒度序列表示;构建神经机器翻译模型,基于所述神经机器翻译模型对所述语料文本数据的多粒度序列进行翻译,获得目...
- 赵亚慧金晶崔荣一金国哲张振国李德李飞雨姜克鑫王苑儒刘帆夏明会鲁雅鑫赵晓辉
- 基于共现词映射的中英韩跨语种文档相似度计算
- 2018年
- 该文采用中英韩跨语种文本数据研究不同语种文档间相似度的计算方法。首先,通过共现词映射将某语种空间中的文档向量表示成另一语种空间中的文档向量;其次,利用潜在语义分析补充了不同语言间一词多义现象造成的向量缺失;最后,在具有等价语义信息的同一语种空间中计算了两个文档之间的余弦相似度。该文工作避开了外部词典和知识库,利用中英韩三个语种的对齐语料库,建立了不同语种词汇间的对应关系。结果表明,共现词映射对计算不同语种文档之间的相似度具有较大影响,对同语义的不同语种文档(即译文)的检索准确率达到95%,验证了该方法的有效性。
- 刘娇崔荣一赵亚慧
- 关键词:潜在语义分析
- 基于机器学习的高校毕业论文课题信息分析方法被引量:2
- 2021年
- 为协助教师详细了解毕业论文的课题分布情况,指导学生合理选择毕业论文课题,提出了一种基于机器学习的高校毕业论文课题信息分析方法.首先,对收集的论文课题信息文本进行规范化、去重、删除无关数据、分词等预处理,并通过人工筛选建立专业术语词典;其次,基于逆文档频率和专业术语确定特征词,利用TF-IDF算法和专业术语因子计算特征词的权重并构造归一化文档向量;最后,采用DBSCAN算法进行聚类,并采用Rand指数进行聚类评价,以此提取出Top-K高频特征词,并将其作为类簇描述的关键词.实验结果表明,该方法可有效分析论文课题内容的分布情况,进而为评价和设计毕业论文课题提供有效的依据.
- 李路军赵云崔荣一赵亚慧
- 关键词:文本聚类DBSCAN聚类算法
- 蜂群遗传算法
- 本文针对传统遗传算法存在'种群多样性'和'选择压力'的矛盾问题,提出一种蜂群遗传算法.算法主要操作包括蜂后的绝对交配权,雄蜂的自适应交叉,工蜂的自适应变异和蜂后的相似性抑制.实验结果表明该算法有较好的搜索性能和较少的计算...
- 吴迪崔荣一
- 关键词:搜索性能
- 文献传递
- 网络数据库系统中数据统计的并行处理
- 2006年
- 以上网费计算为例,叙述在W indow s 2000局域网中用SQL Server 2000数据库管理系统实现数据统计并行处理的设计思想,这种并行算法提高了统计效率,确保了系统数据的安全性,而且能够做到在统计过程中某工作站的撤消与插入不影响最终统计结果。
- 徐善针崔荣一洪炳熔
- 关键词:并行处理数据分解局域网