唐积强 作品数:7 被引量:33 H指数:3 供职机构: 国家互联网应急中心 更多>> 发文基金: 国家自然科学基金 北京市科技新星计划 国家242信息安全计划 更多>> 相关领域: 自动化与计算机技术 经济管理 电子电信 更多>>
BGPNRE:一种基于BERT的全局指针网络实体关系联合抽取方法 被引量:3 2023年 实体-关系联合抽取指从非结构化文本中联合抽取出实体-关系三元组,是信息抽取和知识图谱构建的一项关键任务。文中提出了一种新的基于全局指针网络实体关系联合抽取方法BGPNRE(BERT-based Global Pointer Network for Named Entity-Relation Joint Extraction),首先通过潜在关系预测模块预测文本中蕴含的关系,过滤掉不可能存在的关系,将实体抽取限制在预测的关系子集中;其次通过使用基于关系的全局指针网络,获取所有主客体实体的位置;最后通过全局指针网络通信模块,将主客体位置高效率地解码对齐成一个实体关系三元组。该方法避免了传统管道式方法存在的错误传播问题,同时也解决了关系冗余、实体重叠、Span提取泛化不足等问题。实验结果表明,所提方法在多关系和重叠实体抽取上表现卓越,并且在NYT和WebNLG公共数据集上达到了最先进的水平。 邓亮 齐攀虎 刘振龙 李敬鑫 唐积强基于启发式的比特币地址聚类方法 被引量:11 2018年 针对比特币这种新型的数字货币,通过分析其交易规律和交易地址关系,综合多个交易聚类特征,提出一种基于启发式条件的聚类方法,能够对匿名比特币地址进行相关性聚类,从而发现被同一用户团体控制的地址群,有助于分析用户的交易特征,推测用户的真实身份.设计了具体的聚类方案,分析了迭代次数对聚类效果和代价的影响.大量的实验分析结果验证了该方法的准确性和全面性. 毛洪亮 吴震 贺敏 唐积强 沈蒙关键词:聚类 基于prompt和知识增强的方面级情感分析 被引量:1 2023年 方面级情感分析是一种新兴的细粒度情感分析任务,旨在根据给定句子和方面词判断情感极性。目前广泛使用的预训练语言模型由于训练目标和方面级情感分析的目标有差异,分析结果不好。为了缓解预训练语言模型和情感分析目标的差异,prompt被引入到方面级情感分析中,采用伪标签加方面词和意见词的方式创建prompt连续模板,并使用prompt-encoder训练伪标签使其拥有语义信息;然后,使用主题图注意力机制融合关于方面词和意见词的外部知识,根据融合外部知识的隐藏向量预测由情感词典组成的候选标签词;最后,采用求和置信度分数的方式将候选标签词的概率映射到情感极性分布空间上。实验表明,该模型在SemEval 2014任务的笔记本电脑数据集和餐厅数据集上将正确率分别提高了1.53%和3.5%。 李阳 李阳 唐积强 朱俊武 高翔关键词:PROMPT 情感词典 基于KVM虚拟化的网络环境自动构建技术研究 被引量:3 2014年 针对传统网络环境构建存在成本高、效率低、可控性差的问题,进行了虚拟网络环境自动化构建技术研究,提出了一种基于KVM虚拟化的网络环境自动构建新技术:首先形式化描述真实网络,根据描述结果利用基于内核的虚拟机(KVM)和Click虚拟化生成主机、路由器,然后采用终端路由器路由表洪泛(TRTF)算法计算路由表信息,通过脚本技术对主机与路由器自动设置,形成最终虚拟网络。实验结果表明,利用本文构建算法,构建规模100个节点的网络环境仅需95s。在构建网络中进行了DDoS模拟实验,结果表明网络连通性状况良好,构建网络可用于网络安全事件重现。 张云 唐积强 闫健恩 张兆心关键词:网络环境 形式化描述语言 P2P网络借贷市场最优结构状态与监管模式研究——基于不同监管阶段的演化博弈分析 被引量:13 2020年 在征信系统等基础设施欠完善的背景下,P2P网络借贷市场带来了一系列的问题,例如行业自律性差、平台跑路失联、行业风险积聚等,通过外部监管约束调节市场已成为行业发展的当务之急.本文通过研究近十年的P2P网络借贷市场的发展与监管机制,将行业监管分为监管粗放与监管密集两个阶段,并使用演化博弈模型分析监管强度如何影响企业经营行为和市场结构.同时,本文重点分析了市场结构在监管加强、行业收缩的条件下的演化过程和最优状态.研究结果表明,随着监管政策的加强,领导型企业具有维持市场优势地位的能力,追随型企业很难扩大市场份额,甚至部分平台较难达到监管标准并逐渐退出市场,市场集中度提高,市场结构从"低集中的竞争结构"转化为"以领导企业为主导、追随企业共存的寡占型市场结构",P2P在转型为网络小贷、消金公司后的市场结构应朝这一方向努力. 彭可 吴震 唐积强 郭海凤关键词:P2P网络借贷 市场结构 演化博弈 KENAOTE:一种知识增强的方面和意见对提取多任务学习模型 被引量:1 2023年 方面和意见对提取旨在根据给定句子提取方面和意见项并匹配关系,然而相关研究通常独立提取方面和意见项,而不识别关系。为了识别方面和意见项关系,提出一种知识增强的方面和意见对提取多任务学习模型。首先使用预训练语言模型为文本生成具有语义信息的词向量,为了实现知识增强的效果,使用遮蔽注意力的方式将知识图谱的语义信息融入词向量中,然后使用基于距离注意力和条件随机场的序列标注方法提取方面和意见项,最后再将提取的方面和意见项两两匹配预测对应关系。为了加强方面和意见项提取模块和匹配模块的联系,采用共享编码层的方式实现联合训练。在训练流程中,匹配模块采用真实标签作为输入,在测试过程中采用提取模块的结果作为输入。为了证明模型的有效性,使用三个通用领域数据集进行对比实验,该模型在方面和意见项匹配任务中F 1值分别达到66.99%、75.17%和67.30%,并优于其他比较模型。 李阳 李阳 唐积强 朱俊武 高翔基于知识增强的命名实体识别方法研究 被引量:1 2023年 命名实体识别作为自然语言处理中一项十分基础的任务,其目的是从一段用自然语言描述的文本中识别出相应的实体及类型。知识图谱作为以三元组形式存在的外部知识,已经在很多自然语言处理任务中得以应用并取得了良好效果。文中提出了一种基于知识图谱信息增强的注意力对齐命名实体识别方法,首先通过嵌入层和注意力机制嵌入知识图谱信息,获取知识图谱三元组信息的表示;其次通过BERT-BiLSTM获取句子的上下文表示;然后通过一种注意力对齐模块分配三元组权重融合知识图谱信息与句子信息的表示;最后通过softmax控制融合后的表示向量的预测输出,进而获取实体的标签。该方法有效避免了因知识图谱的融合而改变原句子的语义信息,同时也使得句子中的词向量具有丰富的外部知识。所提方法在中文通用数据集MSRA和医疗领域专用数据集Medicine上的F1值分别达到了95.73%和93.80%,相比基线模型提升了1.21%和1.3%。 高翔 高翔 唐积强 朱俊武 李阳关键词:命名实体识别