李星 作品数:23 被引量:100 H指数:7 供职机构: 国家数字交换系统工程技术研究中心 更多>> 发文基金: 国家自然科学基金 国家高技术研究发展计划 国家自然科学基金创新研究群体项目 更多>> 相关领域: 自动化与计算机技术 电子电信 自然科学总论 更多>>
基于门控卷积机制与层次注意力机制的多语义词向量计算方法 被引量:4 2018年 现有的将词映射为单一向量的方法没有考虑词的多义性,从而会引发歧义问题;映射为多个向量或高斯分布的方法虽然考虑了词的多义性,但或多或少没能有效利用词序、句法结构和词间距离等信息对词在某一固定语境中语义表达的影响。综合考虑以上存在的问题,该文提出了一种基于非残差块封装的门控卷积机制加以层次注意力机制的方法,分别在所选取语境窗口中词的子语义层、合成语义层获得非对称语境窗口下目标单词的合成语义向量以预测目标单词,并按此法在给定语料上学习得到多语义词向量的计算方法。小规模语料上用该方法得到的多语义词向量,在词类比任务的语义类比上相比于基线方法准确率最高可提升1.42%;在WordSim353、MC、RG、RW等计算单词相似度任务的数据集上相比于基线方法能够达到平均2.11的性能提升,最高可到5.47。在语言建模实验上,该方法的语言模型性能相比于其他预测目标单词的方法也有显著提升。 柳杨 吉立新 黄瑞阳 朱宇航 李星基于交互行为和连接分析的社交网络社团检测 被引量:2 2017年 社交网络的迅猛发展极大地方便了人们的日常生活、工作和学习,但也带来了大量复杂的交互行为和连接模式。如何有效地综合分析网络中的交互信息和网络节点之间存在的连接信息,进而完成高效的社团检测,是在当前网络多维属性的复杂背景下进行网络分析所面临的关键难题。基于此,从有效融合两类不同的异质信息研究出发,提出了一种基于交互行为和连接分析的社交网络社团检测(CDUILS)方法。该方法基于两类信息能够从不同的角度反映网络同一个社团归属的假设,采用联合非负矩阵分解架构,以迭代更新的方式,同时利用两类信息进行社团结果的获取。在真实网络数据集上的实验表明,与已有方法相比,所提方法能够有效融合两类信息进行社团检测,取得了更好的社团划分质量。 李鹏 李英乐 王凯 何赞园 李星 常振超关键词:交互信息 非负矩阵分解 社交网络 一种基于资源传输路径拓扑有效性的链路预测方法 被引量:14 2020年 链路预测旨在利用网络中已有的拓扑结构或其他信息,预测未连边节点间存在连接的可能性。资源分配指标具有较低复杂度的同时取得了较好的预测效果,但在资源传输过程的描述中缺少对路径有效性的刻画。资源传输过程是网络演化连边产生的重要内在动力,通过分析节点间资源传输路径周围拓扑的有效性,该文提出一种基于资源传输路径有效性的链路预测方法。该方法首先分析了节点间潜在的资源传输路径对资源传输量的影响,提出资源传输路径有效性的量化方法。然后,基于资源传输路径的有效性,通过对双向资源传输量进行刻画,提出了节点间传输路径的有效性指标。在12个实际网络数据集上的实验测试表明,相比其他基于相似性的链路预测方法,该方法在AUC和Precision衡量标准下能够取得更好的效果。 王凯 李星 兰巨龙 卫红权 刘树新关键词:复杂网络 链路预测 有效性 基于权重微博链的改进LDA微博主题模型 被引量:9 2016年 社交网络尤其是微博中含有大量的短文本。短文本不同于传统的文本,其携带的语义特征信息密度低,很难对其进行准确的主题挖掘。针对这一问题,提出根据微博发布时间与原创、转发、评论微博等社交行为信息分配权重,使用背景知识丰富语义特征的微博链结构与基于此改进的LDA主题模型。实验结果表明,相比于标准的LDA模型,本模型的perplexity值更低,即具有较低的预测不确定度。 李鹏 于岩 李英乐 李星 何赞园关键词:主题挖掘 PERPLEXITY 音频检索方法及装置 本申请提供了一种音频检索方法实施例,本实施例在获取到待检音频后,根据样本音频截取待检音频片段,并获取待检音频片段及样本音频中相同位置的某个或某些帧的特征编码,将样本音频及待检音频片段的某个或某些帧的特征编码进行比对,以初... 李邵梅 朱宇航 李星 葛东东 朱俊光 李春伟电信网信令安全主动防护方法 本发明涉及一种电信网信令安全主动防护方法,通过对信令数据在承载的协议种类、呼叫标识、携带参数和传送通道进行多维一体的动态等价变换,使得同一呼叫或不同呼叫中涉及的控制信令,在时空域上失去其固有的相似性和确定性,呈现出多样化... 马宏 黄海 朱宇航 李英乐 李星 李鹏 郑修猛文献传递 基于模糊积分多分类器融合的JPEG图像隐写算法识别 被引量:1 2012年 提取和恢复嵌入信息是隐写分析的最终目的,嵌入算法识别是秘密信息提取的前提。目前研究者针对隐写算法识别提出了多种隐写分析系统,但这些系统各有优缺点,因此实际应用中难以取舍。文章提出基于模糊积分的多分类器融合方法来识别JPEG图像隐写算法。实验结果表明,相对于单个隐写分析系统,通过分类器融合后识别精度提高约5%。 李开达 张涛 李星关键词:模糊积分 多类分类 分类器融合 一种融合节点文本属性信息的网络表示学习算法 被引量:11 2018年 现有网络表示学习算法主要针对网络结构信息进行表示学习,而忽略现实网络中丰富的节点文本属性信息。为有效融合网络结构信息和节点文本属性信息进行表示学习,提出一种新的网络表示学习算法。为实现两方面信息在训练过程中的相互约束,建立基于参数共享的共耦神经网络训练模型,并利用负采样和随机梯度下降的优化策略实现训练过程的快速收敛。实验结果表明,与Doc2Vec算法、DeepWalk算法、DW+D2V算法和TADW算法相比,该算法的分类性能更好。 刘正铭 马宏 刘树新 杨奕卓 李星关键词:复杂网络 信息融合 神经网络 IBNAD:一种基于交互的5G核心网网络功能异常检测模型 2024年 现有5G(5th GenerationMobile Communication Technology)核心网异常检测主要基于信令流量深度解析,但较少利用核心网网络功能交互关系的作用。针对上述问题,提出一种基于交互的5G核心网网络功能异常检测模型。首先,该模型以行为分析为驱动,基于信令流量和网络功能注册数据提取多维属性,通过行为画像来表征网络功能行为模式,并采用集成学习算法RFECV(Recursive Feature Elimination with Cross-Validation)进行属性特征选择,降低特征维度的同时筛选出与区分网络功能行为模式高度相关的属性特征。然后,模型基于网络功能交互关系对核心网进行图建模,建模后的图数据融合了网络功能属性信息和交互信息。最后,模型通过基于空间域的图卷积网络聚合邻域节点属性信息和结构信息来融合行为模式特征,新生成的节点表示用于分类,从而将核心网网络功能异常检测问题转化为图节点分类问题。通过在free5GC仿真平台上采集数据,并在搭建的异常检测系统中的实验表明,该模型的异常检测性能优于基于属性特征分析的传统机器学习模型、基于结构特征分析的图嵌入模型及部分5G核心网异常检测模型。10%数据集作为训练集时,所提模型的准确率比支持向量机模型提高6.6%,比Struc2vec模型提高13%,比深度神经网络模型提高8%。 张伟露 吉立新 吉立新 李星 刘树新 胡鑫鑫关键词:异常检测 网络建模 融合连边符号语义信息的网络表示学习算法 2020年 为融合连边符号语义信息提升网络表示学习质量,针对现有算法处理复杂连边符号语义信息能力较弱问题,提出一种融合连边符号语义信息的网络表示学习算法,将包含正负关系的连边符号语义信息引入网络表示学习过程。首先,该算法设计基于三层感知机的关系预测模型刻画节点间不同类型的上下文链接关系;然后,引入随机游走策略实现上下文链接采样以适应大规模网络场景训练需求。在三个数据集中实验表明,该算法能够有效建模节点间不同类型的上下文链接关系,挖掘其中包含的复杂语义信息,相比目前最优的SIDE方法,所提算法的性能分别提高了0.31%、1.3%和1.85%。 王凯 赵学磊 李英乐 刘正铭 李星关键词:信息融合