延边大学工学院计算机科学与技术学科
- 作品数:43 被引量:53H指数:4
- 相关作者:蔡京哲侯继文刘宝超李京王梦娇更多>>
- 相关机构:东南大学经济管理学院东南大学经济管理学院系统工程研究所黄淮学院计算机科学系更多>>
- 发文基金:吉林省科技发展计划基金吉林省自然科学基金国家自然科学基金更多>>
- 相关领域:自动化与计算机技术轻工技术与工程理学文化科学更多>>
- 朝鲜文字信息结构的研究被引量:1
- 2011年
- 该文研究了朝鲜文字空间结构中不同位置上的基本字母对文字结构的分类所提供的信息贡献。首先,提出了文字的结构距离的概念与计算方法,描述了不同结构之间的差异;其次,研究了文字结构的等价类划分方法以及文字结构的概率分布;最后,通过计算结构分类时不同位置上的基本字母的信息增益,刻画了文字中信息的分布结构。对实际朝鲜语文档的实验表明,c1-v2、c1-v1-c3、c1-v2-c3型结构的文字具有显著的高概率特性,v1、v2类型和c3类型字母对结构分类的影响最大。
- 崔荣一金世珍
- 关键词:信息增益
- 基于术语自动抽取的科技文献翻译辅助系统的设计被引量:4
- 2017年
- 设计了一种中韩科技信息综合平台中的翻译辅助系统.首先,依据关键词确定的组词特证获取候选术语,并使用互信息评估候选术语以实现术语自动提取.其次,将已有术语、抽取到的新术语、术语译文和历史翻译记录等信息存储到系统数据库中建立术语库.最后,设计翻译工作者的用户接口,使其通过该接口获取已有术语的译文信息、新术语的相似译文信息和译文记忆库为基础的历史翻译数据.测试结果表明,本文设计的术语自动抽取功能和辅助译文生成功能达到了预定的设计目标,术语自动抽取算法召回率达到61.8%,结合优化方法进行优化后达到66.9%;辅助译文生成平均延时为0.031s,MRR为0.951,测试结果满足用户需求.
- 黄政豪崔荣一
- 关键词:术语抽取
- 基于帧符号化的语音相似性度量方法
- 2014年
- 提出了将语音帧符号化后度量语音相似性的方法.首先,去除语音段中的静音部分,并提取每帧语音的MFCC参数;其次,将MFCC参数进行k均值聚类和KNN分类,并根据分类结果对语音信号进行符号化;最后,采用编辑距离计算语音段之间的相似性.实验表明,将语音符号化后,音频之间的可区分性更加明显,识别率也有了明显提高.
- 刘双君金小峰崔荣一
- 关键词:K均值聚类KNN分类符号化
- 基于分布式图计算的学术论文推荐算法被引量:5
- 2019年
- 针对海量论文数据导致的应用效率低下问题,提出一个基于层次混合模型的推荐算法WSVD++。该模型根据学术论文良好的结构特征,构建一个加权的论文二部图模型。首先对论文进行特征提取,按不同特征的权重构建论文的复合关系图;其次对关系图采用一种改进的PPR算法,计算每篇论文的重要程度,依此来对用户—论文关系进行加权;然后在构建好的加权二部图模型上混合SVD++图算法进行推荐。实验结果表明,改善了推荐算法学术论文的推荐效果,并且基于分布式图计算框架GraphX,扩展性好,适合大数据处理。
- 潘峰怀丽波崔荣一
- 关键词:协同过滤
- 基于数据库的高校设备采购管理系统的应用研究被引量:2
- 2008年
- 本系统是基于数据库基础开发了一套高校设备采购管理系统,极大地提高了设备采购管理工作人员的工作效率,大大减少了以往出现的管理杂乱的弊端,实现了设备采购管理的操作的自动化和信息的电子化,从而全面提高了全校设备材料采购管理水平。
- 赵亚慧
- 关键词:数据库设备管理
- 线性化朝鲜文字的歧义性研究被引量:2
- 2008年
- 该文研究了线性化朝鲜文字重构过程中存在的固有的歧义性问题,并讨论了歧义性消除方案。首先,研究了描述朝鲜文字结构的形式化方法,给出朝鲜文字组成的基本规则和相应的有限状态自动机;其次,给出文字线性化与重构的数学描述,论证了文字重构时存在歧义性的必要条件和充分条件,并分析了线性化文字序列歧义度的本质和歧义性发生的概率;最后,讨论了文字重构歧义性消除的方案,给出了基于基本字母的在线式朝鲜文字序列输入算法和核心步骤,通过仿真实验验证了该方案的可靠性和有效性。
- 蔡京哲崔荣一
- 关键词:计算机应用中文信息处理
- 基于最大Jaccard相似度的互激励实体验证算法被引量:1
- 2015年
- 针对基于规则的信息抽取技术提出了一种互激励实体验证算法.该算法兼顾了信息抽取过程中互激励算法的优点,并在此基础上引入了实体等待队列,用于存储未被成功验证的实体,并以最大Jaccard相似度为原则进行实体验证.实验结果表明,将该算法应用在基于规则的参考文献命名实体抽取中,其抽取的准确率要比SermeX系统高约15%,比Para Tools系统高约40%.
- 刘宝超崔荣一
- 关键词:信息抽取
- 面向cocos2dx的代码混淆器的设计与实现
- 2015年
- 针对目前使用的代码混淆技术不能完全适用于手机的问题,在分析常用的代码混淆技术的基础上,提出用于手机引擎cocos2dx的基于代码匹配的混淆方法,即在外形(layout)混淆的基础上利用代码匹配技术搜索相同功能的代码并替换成更难让人读懂的形态.试验分析表明,该方法的混淆效果好于传统外形混淆效果,执行程序过程中不仅没有降低运行效率,在某些情况下运行效率还有所提升.
- 王晓宇蔡京哲
- 关键词:代码混淆手机软件
- 基于编辑距离的中文机构名简称检索方法研究被引量:1
- 2010年
- 文章针对基于中文机构名简称的检索方法,研究了机构名的结构特征,提出了中文机构名简称和全称匹配的一种新算法的应用,通过计算中文机构名简称与机构名全称的编辑距离,达到快速检索目标机构的目的。仿真实验结果表明:所提的方法准确性较好,首选准确率较高,达到了适用要求。
- 赵亚慧
- 关键词:文本分类分词算法
- 一种快速的随机分块文本检索算法
- 2010年
- 针对向量空间模型(VSM)在信息检索中存在脱离上下文语境的缺陷,提出一种新的随机分块文本检索算法。该算法利用潜在语义分析技术在低维空间中对检索文本与待检索文本的各个段落进行投影,使用SVD技术对其进行了降维处理,得到文本特征,然后依据该文本特征进行相似的匹配,获得检索结果。由于充分考虑了文本的上下文语义信息,算法能够有效提高检索效率。实验结果表明,该算法在检索时间、查准率、召回率及综合性能等方面均得到较好的效果。
- 赵亚慧刘金广崔荣一
- 关键词:向量空间模型文本相似度