张海军
- 作品数:49 被引量:202H指数:7
- 供职机构:新疆师范大学计算机科学技术学院更多>>
- 发文基金:国家自然科学基金新疆维吾尔自治区自然科学基金国家高技术研究发展计划更多>>
- 相关领域:自动化与计算机技术文化科学一般工业技术理学更多>>
- 基于QSA数组计算序列中所有NE重复模式的算法被引量:3
- 2014年
- 序列中重复模式的识别与提取算法在数据挖掘、模式识别、数据压缩、生物信息学等领域中具有广泛的实际应用。提出一种全新的基于QSA数组计算所有带有约束条件的NE重复模式的算法RPT。算法设计中充分考虑了NE重复模式的特征,以建立特征和重复模式检测结果之间的统计联系;算法中的约束条件包括最小周期pmin和最大间距gmax,其可用于筛选符合条件的NE重复模式,并可按照递增序输出所有NE重复模式的出现位置。与已有的基于后缀索引的算法相比,此算法的空间效率得到了提高。在分类属性数据样本集上进行的实验表明,算法RPT对生物序列尤其是DNA序列以及维吾尔语Web文本中NE重复模式的识别与提取都很有效。
- 木妮娜.玉素甫古丽娜.玉素甫张海军
- 关键词:统计特征生物计算
- 基于统计方法的教育术语特征分析研究
- 2014年
- 领域术语特征研究是领域术语自动抽取的基础。研究抽取词典词条和领域高频术语集构建教育术语库,使用中科院分词软件和统计方法对教育术语的特征进行分析。分析结果表明教育术语字长为2-11,词长为1-6词,单词术语占教育术语库28%。对比教育、科技和法律的术语特征发现其具有显著区别,对领域术语自动抽取及信息处理相关研究具有重要理论意义。
- 闫琪琪张海军
- 关键词:教育术语术语自动抽取
- 一种融入客观赋权法的社交网络谣言源识别方法
- 本发明涉及信息安全领域,公开了一种融入客观赋权法的社交网络谣言源识别方法,包括构建网络谣言源识别有限无向图;利用SIR传染病模型模拟谣言传播过程;提取所有节点的若干个节点属性值;对所有节点的若干个节点属性值进行归一化处理...
- 周中月张海军
- 基于大规模语料划分的频繁模式查找算法被引量:1
- 2012年
- 频繁模式查找对新词识别、网络舆情监测、生物信息序列检测等领域有很高的应用价值。为处理规模远超出内存的语料,提出了一种实用的频繁模式查找算法。先将语料按后缀首字符划分为多个集合,通过逐条扫描集合数据,搜索出最大化最长公共前缀区间(MLCPI)来完成查找。另外在此基础上提出逐层归并算法,实现查找的同时归并子串。由于进行查找时无需将全部数据导入内存,因此资源消耗较少;各集合间频繁模式查找互不干扰,可采用并行处理加快运行速度。使用4.61G纯文本语料进行了试验,结果表明其内存消耗小于30M,查找速度最快达1.08M/s,能高效地进行子串归并。
- 丁溪源黄河燕张海军王树梅
- 克隆算子在民族图案生成中的应用研究被引量:1
- 2012年
- 为了解决民族图案艺术得到传承和发扬的问题,提出了民族图案基元、民族图案元和民族图案再生元的概念。引进克隆算子对民族图案基元进行操作,并提出一种民族图案生成算法。利用本文提出的算法对民族图案的生成做实验,民族图案基元通过克隆操作、免疫基因操作、克隆选择操作和克隆死亡操作后能生成新的图案元。实验结果表明在继承图案民族内涵的情况下,能够生成新的民族图案元和再生图案元。利用本文提出的图案生成方法,可以为艺术设计者提供取之不尽的创新设计元素。
- 刘战东李勇张海军赵彩霞
- 关键词:民族图案
- 一种融入客观赋权法的社交网络谣言源识别方法
- 本发明涉及信息安全领域,公开了一种融入客观赋权法的社交网络谣言源识别方法,包括构建网络谣言源识别有限无向图;利用SIR传染病模型模拟谣言传播过程;提取所有节点的若干个节点属性值;对所有节点的若干个节点属性值进行归一化处理...
- 周中月张海军
- 文献传递
- 教师信息技术与课程整合能力培养研究被引量:1
- 2014年
- 随着教育信息化的持续推进,教师信息素养逐渐受到社会各界的关注。目前教师信息素养培养片面关注信息技术及操作能力的提升,导致教师信息技术与课程整合能力的缺失,造成实际教学中教师对信息化教育理解的偏差。探讨教师信息技术与课程整合能力的培养对提升教师信息素养、推动教育信息化进程具有重要的意义。
- 闫琪琪张海军
- 关键词:教师信息素养信息技术课程整合能力
- 一种基于数据增强的科技文献关键词提取模型
- 2024年
- [研究目的]科技文献关键词提取研究具有重要价值,目前研究中关键词提取方法存在较大误差且只能提取文本中的关键词,难以根据深层语义信息提炼出更符合文本核心主旨的词语。本研究针对关键词提取对上下文隐含语义挖掘不足导致的局限性和重点信息关注不足问题开展研究。[研究方法]提出一种基于数据增强的关键词提取模型(GPT-2 BiLSTM Mul-Attention,GPBA),通过语言模型进行数据增强,并结合BiLSTM+Mul-Attention提取模型进行多特征语义信息融合理解。[研究结论]实验结果表明,基于数据增强的关键词提取模型GPBA总体表现优于其他基线模型,并且能更精确地凝练和提取文本中的关键词。
- 程芮张海军
- 关键词:语义信息
- 一种自定义顺序的字符串排序算法被引量:4
- 2012年
- 现有的排序算法很难实现自定义顺序的字符串排序,提出一种自定义顺序的字符串快速排序方法.在应用连续编号定义字符排序顺序的基础上,使用哈希表结构将字符串转换成对应的整型数组,以字符的最大编号作为基数排序算法的新基数,实现字符串的基数排序.分析和实验表明,本文方法可有效实现自定义顺序的字符串排序,是一个时间和空间复杂度都是线性的排序算法,比快速排序(Quick Sort)具有更好的时间性能,且可以方便地推广到其它语言的字串排序中.
- 张海军潘伟民木妮娜栾静
- 关键词:哈希表
- 基于大规模语料的中文新词识别技术研究
- 中文新词识别是指从未标注文本语料中抽取新词并识别其属性的过程,是中文信息处理领域的一项基础任务,其识别结果直接影响着分词、句法分析的处理性能,同时亦在信息抽取及机器翻译等领域有着广泛应用,具有重要的理论意义和实用价值。 ...
- 张海军
- 关键词:大规模语料条件随机域
- 文献传递