刘冬明
- 作品数:13 被引量:41H指数:3
- 供职机构:中北大学电子与计算机科学技术学院更多>>
- 发文基金:国家重点基础研究发展计划国家高技术研究发展计划山西省基础研究计划项目更多>>
- 相关领域:自动化与计算机技术语言文字更多>>
- 量化词语的领域特征被引量:1
- 2014年
- 词作为最小的语义单位,同领域之间具有复杂的关系,特别是较为常用的词,通常难以明确界定其所属领域。在某些应用中并非必须确定词和领域的明确关系,仅仅依赖词的领域性的量化值就能够取得较好的效果。该文根据大规模语料库中词的关联信息,采用无指导的方法,对词的领域性进行量化,其结果可以作为词的一种特征应用于文本分类、话题检测、信息检索等相关的自然语言处理中。最后,通过和常用的特征——TF*IDF在话题检测应用中进行对比,证明了其有效性。
- 刘冬明杨尔弘
- 关键词:IDF
- 汉英双语语料库中名词短语的自动对应被引量:10
- 2003年
- 本文提出了一种在汉英双语语料库句子对齐的基础上,自动进行汉英名词短语划分和对应的方法。该方法的主要特点在于在无需严格识别汉语名词短语的情况下,对高频短语和低频短语分别进行处理,对于高频短语,利用英语短语和汉语词在双语语料库中的关联信息,采用一种迭代重估算法进行双语短语的对应;对于低频短语,根据双语词典中源词和译词之间的对应信息,结合一套人工编写的句法规则进行双语低频短语的对应。该方法能够从整体上把握对应信息,并具有很高的覆盖率。
- 刘冬明赵军杨尔弘
- 关键词:人工智能机器翻译相似度
- 汉英双语平行语料库中对齐方法的研究
- 在自然语言处理领域,双语平行语料库的重要性日益加强,其研究工作主要是集中在构建、对齐和标注等方面.它在在机器翻译、词典编纂、多语言信息检索、术语提取等领域有着重要的研究价值.在过去的三十年里,各国的研究人员相继建立了许多...
- 刘冬明
- 关键词:词义排歧
- 文献传递
- 一种新的双语语块对应算法被引量:1
- 2004年
- 提出了一种新的语块对应算法 ,该算法是建立在实词对应基础上来划分语块的 ,这样可以保证语块正确对应的同时 ,有效地避免了双语语块边界划分不一致的情况。实验结果表明 。
- 刘冬明杨尔弘
- 关键词:粗糙集理论学习算法英语语法英语语块英语教学
- 基于特征调制图神经网络的智能合约源码漏洞检测
- 2024年
- 随着区块链技术的广泛应用,智能合约的安全问题引起广泛关注。针对智能合约源码向字节码转化会丢失部分语义信息,而现有深度学习漏洞检测方法不能很好地检测重入漏洞和时间戳漏洞等问题,本文提出一种基于特征调制图神经网络的智能合约源码漏洞检测方法(GNN-film)。首先,分析重入漏洞和时间戳漏洞的特点,使用智能合约源码构建图结构并将其精简化;其次,搭建基于特征级线性调制的图神经网络模型,利用该网络模型强大的特征调制能力对合约漏洞特征进行精确表示;最后,将精简化后的图结构数据输入搭建的模型中获得检测结果。实验结果显示,本文方法对重入漏洞和时间戳漏洞检测的准确率达到91.00%和91.64%,相较基于图神经网络的方法分别提升了4.20百分点和9.70百分点,证明本文方法对相关漏洞检测的能力要优于其他检测工具。
- 师自通师智斌刘冬明石琼龚晓元
- 关键词:漏洞检测
- 基于汉英双语平行语料库的词义排歧
- 本文充分利用当前HowNet资源中概念的可计算性和句子对齐的汉英双语平行语料库信息,将词义排歧的问题转化为两种语言相对应句子词义组合的相似度计算问题,进而利用动态规划法的思想设计出一种在一定的时间和空间复杂度内,有效的标...
- 刘冬明杨尔弘
- 关键词:词义排歧HOWNET双语平行语料库
- 文献传递
- 汉英双语平行语料库的词义标注被引量:4
- 2005年
- 本文充分利用当前HowNet资源中概念的可计算性和句子对齐的汉英双语平行语料库信息,将词义排歧的问题转化为两种语言相对应句子词义组合的相似度计算问题,进而利用动态规划法的思想设计出一种在一定的时间复杂度内,有效的标出多义词义项的算法。该方法从以前对每个多义词进行排歧时只考察其上下文环境和对应信息,改变到对句子中所有的词同时考察上下文环境,这样就可以站在句子高度来进行词义标注,最终取得了满意的实验结果。
- 刘冬明杨尔弘方莹
- 关键词:人工智能自然语言处理词义排歧HOWNET双语平行语料库
- 话题内相关文本的内容计算被引量:1
- 2015年
- 信息的暴涨给文本处理带来了更多的挑战。话题检测能够把大量的信息以话题为单位有效地组织起来,然而最终用户有可能并不需要涉及某一话题的所有文本,而是仅仅关心该话题的具体内容。在我们根据相关文本智能表达话题内容推送给用户之前,自动从相关文本中挑选符合用户需求的文本是一个非常有意义的工作。本文致力于相同话题文本之间的内容比较,目的是有效地选出满足需求的文本。我们通过对话题进行重新定义,并根据此定义设定了话题和文本的表示方法,给出了基于该表示方法的话题和文本之间的内容比较计算方法。最后,通过实验说明了这一系列方法的有效性。
- 刘冬明杨尔弘
- 关键词:文本表示
- 基于欠采样和源代码图表征的以太坊庞氏骗局检测
- 2023年
- 针对目前以太坊庞氏骗局检测中存在的数据类别不平衡,特征来源单一和不能完整表达智能合约的语义语法关系和程序依赖关系等相关问题,提出了一种基于欠采样和源代码图表征的以太坊庞氏骗局检测方法。该方法利用Levenshtein算法计算训练集中多数类智能合约之间的距离,进而通过K-Means算法对多数类智能合约进行聚类,有选择地丢弃多数类合约,保证了训练集骗局合约和正常合约的类别相对平衡,提高了分类器对异常合约的敏感程度;针对庞氏骗局合约的代码特征改进了构图算法,通过剔除冗余特征,添加新的核心节点来解构智能合约的语义语法信息和程序依赖关系,使得神经网络更容易捕获和学习骗局合约的行为特征和资金流向模式。在XBlock数据集上进行了实验,结果表明本文提出的方法在保证精度的同时,召回率达到98%,优于现有方法。
- 龚晓元刘冬明高峰师自通
- 机器更新对蠕虫传播影响被引量:1
- 2011年
- 对机器的更新换代对蠕虫传播、演化等动力学行为的影响进行了研究,给出了一个蠕虫传播模型,运用动力学分析方法得到了模型的平衡态及其稳定性条件,并进行了仿真验证。理论分析与仿真结果均表明,机器更新会导致蠕虫的持续。仿真结果还表明,机器更换率对蠕虫的传播具有双重影响。在基本再生数的指导下,通过提高防病毒系统预装率,能减弱机器更新带来的负面影响,并能有效抑制蠕虫的传播。
- 宋礼鹏韩燮刘冬明张建华
- 关键词:网络安全蠕虫平衡态稳定性动力系统