倪丽萍
- 作品数:80 被引量:187H指数:7
- 供职机构:合肥工业大学更多>>
- 发文基金:国家自然科学基金国家高技术研究发展计划安徽省自然科学基金更多>>
- 相关领域:自动化与计算机技术经济管理文化科学电气工程更多>>
- BERT模型和异质图注意力网络的篇章级事件抽取方法
- 本发明公开了一种BERT模型和异质图注意力网络的篇章级事件抽取方法,其步骤包括:1、通过BERT预训练模型获取特征表示,利用CRF层进行实体识别;2、将特征表示输入前馈神经网络以检测文档所包含的事件类型;3、构建一个包含...
- 倪丽萍韩露倪志伟朱旭辉陈星月丁翔
- 基于相空间重构的股价时间序列相关性分析被引量:3
- 2010年
- 股指的相关性研究对于衍生产品定价、风险管理、套期保值和最优投资组合选择等都具有重要的意义。股指相关性研究大都是在线性理论的基础上,即认为股指时间序列是线性的,但是实际上,股指时间序列具有很强的非线性特征,因此在线性理论基础上得到的相关性结果具有一定的局限性。应用非线性的混沌理论,通过对沪深股指混沌时间序列进行相空间重构,建立了一个多维的股指时间序列系统。运用典型相关分析对构建的系统进行相关性计算,得到沪深股指之间的相关性。
- 查春生倪志伟倪丽萍公维峰
- 关键词:时间序列相空间重构
- 基于词向量和集成SVM的文本数据流分类方法
- 本发明公开了一种基于词向量和集成SVM的文本数据流分类方法,其步骤包括:1、从文本数据集中获取种子文本集;2、对种子文本集进行词向量扩充处理,获得相应的特征词典及噪声词典;3、对所述文本数据集进行特征加权向量化处理,获得...
- 倪丽萍夏千姿倪志伟朱旭辉夏平凡李想
- 文献传递
- 基于近邻传播的文本数据流聚类算法
- 本发明公开了一种基于近邻传播的文本数据流聚类算法,其特征是按如下步骤进行:1对文本数据集进行降维处理,获得相应的文本向量集;2获得所有时刻的聚类中心,并完成聚类算法。本发明不需要预先指定聚类个数,就能提高算法的准确率和鲁...
- 倪丽萍李一鸣倪志伟伍章俊
- 文献传递
- 融合改进二元萤火虫算法和互补性测度的集成剪枝方法被引量:1
- 2018年
- 差异性和平均精度是提高分类器集成性能的两个重要指标。增加差异性势必会降低平均精度,增大平均精度一定会减小差异性。故在差异性和平均精度之间存在一个平衡状态,使得集成性能最优。为了寻找该平衡状态,该文提出融合改进二元萤火虫算法和互补性测度的集成剪枝方法。首先,采用bootstrap抽样方法独立训练出多个基分类器,构建原始基分类器池。其次,采用互补性测度对原始基分类器池进行预剪枝。接着,通过改进萤火虫的移动方式和搜索过程,引入重新初始化机制和跳跃行为,提出改进二元萤火虫算法。最后,采用改进二元萤火虫算法对预剪枝后的基分类器,进行进一步剪枝,选择出集成性能最优的基分类器子集合。在5个UCI数据集上的实验结果表明,较其他方法,使用较少的基分类器,获得了更优的集成性能,具有良好的有效性和显著性。
- 朱旭辉倪志伟倪丽萍金飞飞程美英李敬明
- 关键词:萤火虫算法
- 基于双错测度的极限学习机选择性集成方法被引量:4
- 2020年
- 极限学习机(ELM)具有学习速度快、易实现和泛化能力强等优点,但单个ELM的分类性能不稳定。集成学习可以有效地提高单个ELM的分类性能,但随着数据规模和基ELM数目的增加,计算复杂度会大幅度增加,消耗大量的计算资源。针对上述问题,该文提出一种基于双错测度的极限学习机选择性集成方法(DFSEE),同时从理论和实验的角度进行了详细分析。首先,运用bootstrap方法重复抽取训练集,获得多个训练子集,在ELM上进行独立训练,得到多个具有较大差异性的基ELM,构成基ELM池;其次,计算出每个基ELM的双错测度,将基ELM按照双错测度的大小进行升序排序;最后,采用多数投票算法,根据顺序将基ELM逐个累加集成,直至集成精度最优,即获得基ELM最优子集成,并分析了其理论基础。在10个UCI数据集上的实验结果表明,较其他方法使用了更小规模的基ELM,获得了更高的集成精度,同时表明了其有效性和显著性。
- 夏平凡倪志伟朱旭辉倪丽萍
- 关键词:极限学习机
- 基于改进离散人工蜂群算法的同类机调度优化被引量:7
- 2020年
- 针对一类最小化最大完工时间的同类机调度问题,考虑到机器的加工效率和产品的交付时间,引入同类机调度问题的数学模型,提出一种改进的离散型人工蜂群算法(IDABC)求解该问题。首先,引入种群初始化策略,得到均匀分布的种群,并获得待优参数的生成策略,加快种群的收敛;其次,借鉴差分进化算法的变异算子和模拟退火算法的思想,改进雇佣蜂和跟随蜂的局部搜索策略,并利用最优解的优质信息改进侦察蜂,增加种群多样性、防止算法陷入局部最优;最后,分析算法的性能和参数,并将改进的算法应用于同类机调度问题,在15个算例上的实验结果表明,与混合离散人工蜂群(HDABC)算法相比,IDABC的求解精度和稳定性分别平均提高了4.1%和26.9%,且具有更好的收敛性,表明在实际场景中IDABC可以有效求解同类机调度问题。
- 张架鹏倪志伟倪丽萍朱旭辉伍章俊
- 关键词:变异算子人工蜂群算法
- 一种互联网环境下的金融市场风险预警方法
- 本发明公开了一种互联网环境下的金融市场风险预警方法,其步骤包括:1、数据预处理2、使用TF算法选取情感种子词并利用Word2vec进行情感词典扩展,定义程度副词权重从而计算出文本情感强度指数3、利用MF‑DCCA模型计算...
- 倪丽萍李莹倪志伟朱旭辉李想夏千姿
- 文献传递
- 基于集成SVM数据流分类算法的公司微博金融事件检测方法被引量:3
- 2021年
- 先前事件检测算法需要大量训练样本并且不能动态检测事件。为了从微博短文本中检测金融事件,提出一种从微博中检测公司金融事件的新模型。结合词嵌入与数据流集成分类算法,词嵌入和触发词典用于中文微博文本表示。带有动态时间窗的集成数据流分类算法(DSESVM)用于在线事件分类,大大减少了训练数据并动态检测事件。使用五家上市公司的微博文本作为语料库进行测试,实验结果表明,该方法不仅降低了训练样本的比例,还检测了概念漂移,可以有效提高微博中公司金融事件检测的准确性,相对于已有方法,其平均F1值提升5.6~7.2百分点。
- 夏千姿倪丽萍倪志伟朱旭辉李想
- 关键词:数据流挖掘
- 基于ELECTRA模型与词性特征的金融事件抽取方法研究被引量:6
- 2021年
- 【目的】针对金融事件抽取中金融事件实体边界模糊、抽取不准确的问题,提出基于预训练模型ELECTRA和词性特征的金融事件抽取方法。【方法】为增强模型对金融关键实体的感知力,充分考虑语料原始的语义信息以及词性特征信息,将语料分别通过两个ELECTRA预训练模型后进行融合操作,达到增强语义的效果;将学习到的信息传入BiGRU中,获取上下文长距离的语义依赖,输出原始的序列标签;利用CRF克服标签偏差问题,通过上述步骤完成金融事件抽取。【结果】基于预训练模型ELECTRA和词性特征的金融事件抽取方法在金融事件数据集上F1值达到70.96%,比经典的抽取模型BiLSTM-CRF性能提升20.74个百分点。【局限】数据集中事件数较少,预训练模型体积较大,会受到GPU/TPU内存的限制。【结论】本文模型能够更加全面地捕捉金融事件元素之间的联系,提升金融事件抽取的效果。
- 陈星月倪丽萍倪志伟
- 关键词:ELECTRA