文娟 作品数:15 被引量:43 H指数:3 供职机构: 厦门大学经济学院 更多>> 发文基金: 福建省自然科学基金 教育部人文社会科学研究重大课题攻关项目 国家社会科学基金 更多>> 相关领域: 自动化与计算机技术 经济管理 电气工程 文化科学 更多>>
基于面板数据的数据仓库模型设计 2009年 信息技术是有效发展现代统计工作的重要方向。文章在介绍面板数据的描述方法及主流的数据仓库建模技术的基础上,提出了将面板数据存入数据仓库的方法,即基于面板数据建立其对应的数据仓库模型,当面板数据进入数据仓库系统后便可利用数据仓库系统中前台数据分析功能对原有的面板数据进行更深入的分析了解,也有利于从多组的面板数据中发现一些隐藏的信息,更进一步支持现代统计工作。 文娟关键词:面板数据 数据仓库 星型结构 数据仓库中提高多表连接查询效率的研究 本文讨论了提高数据仓库中多表连接查询效率的问题。
首先,简述了数据仓库与联机分析处理的概念,并介绍了目前研究比较成熟的主要的数据仓库技术。
其次,介绍了关系数据库中的操作语言SQL与多表连接查询相关的... 文娟关键词:数据仓库 多表连接 查询效率 联机分析处理 文献传递 一种基于信息论的归纳分类学习算法 2009年 提出了一种基于信息论的归纳分类学习算法——最大贡献分类算法.该算法根据信息论中信道传输的理论,把类别空间和各特征空间的概率转移矩阵以及互信息结合起来,定义了贡献的概念,从而得出了对给定的观测值,用它的最大贡献作为对实体进行分类的规则.文中通过实例学习与分析,验证了这种算法的有效性和可行性. 林克明 薛永生 文娟关键词:数据挖掘 EDP核算中的几个问题 2008年 在可持续发展理论、生态经济和新经济理论倍受推崇的大背景下,传统的GDP指标受到越来越多的质疑,甚至被称为黑色GDP,把环境资源因素纳入国民产出核算成为近年来国民经济核算理论研究中一种引入注目的焦点。 文娟关键词:EDP核算 可持续发展理论 GDP指标 新经济理论 生态经济 SPT—快速计算FreeCube的方法 2006年 文章首先分析了目前国内外数据立方体计算的研究现状,指出其优缺点。接着在free-set的概念上,给出了一系列相关定义,挖掘了free-set的性质,建立了FreeCube的概念结构。就FreeCube的计算而言,充分考虑到free-set的性质,结合BUC算法的特点,提出了高效的算法SPT(Selecting-PartitionandTrimmingComputationofFreeCube),并从多个角度进行了实验,与相关工作做了对比,说明该算法的优越性。 翁伟 薛永生 文娟 王劲波关键词:数据立方体 DSSMV——多维数据物化视图的动态选择策略 1引言从某种角度看,数据仓库是一组视图的集合。这些视图是从数据库或基库中分组聚集而成的。在物理意义上实际存在的视图称为实视图;物理上不存在,当需要时从其他视图或基库中导出的视图称为虚视图。所谓视图的物化即以表的存储形式将... 黄宗毅 薛永生 文娟 蔡劲 翁伟文献传递 基于缓解特征过度平滑的图神经网络优化算法 被引量:1 2024年 为减少过度平滑对传统图卷积网络(graph convolutional network,GCN)模型性能的影响,提出一种优化算法GCN-optimization。该算法通过增强节点特征并在卷积前将特征重新映射的方法,使节点在经过多层GCN传播过程中仍能保持一定的特征差异。在Cora、Citeseer和Pubmed 3个数据集上进行实验,结果显示:在3个数据集中,相比于原版GCN,GCN-optimization算法Accuracy分别提升2.2%、1.5%和0.5%;Macro-F1分别提升1.8%、1.7%和2.1%。表明,相对于基准模型,GCN-optimization算法在节点分类任务中展现出一定的优势,能够有效缓解传统GCN中的过度平滑问题,保持节点特征的差异性,从而提升模型性能。 林科奥 翁伟 谢小竹 王华伟 文娟关键词:优化算法 基于全局和局部关系的类属特征多标记分类算法 2024年 针对忽视局部关系中的二阶标记关系问题,本文提出了一种基于全局和局部关系的类属特征多标记分类(global and lo⁃cal relationships based on multi⁃label classification algorithm with label⁃specific features,LFGML)算法。通过全局关系的角度来获取类属特征,使用加权平均法计算每个实例的邻域信息,利用杰卡德相似度提取局部关系中的二阶标记关系。LFGML算法在10个多标记数据集Genbase、Medical、Arts、Health、Flags、Cal500、Yeast、Image、Education和Emotions进行了实验。结果表明,所提出的算法相对于其他对比算法在多标记分类中具有明显的的性能优势。 张珊丹 翁伟 谢小竹 魏博文 王劲波 文娟关键词:多标记学习 从统计学视角探索《统计学》课程思政教学改革 被引量:1 2022年 课程思政是时代责任,将课程思政融入高校专业课对教和学都提出了更高的要求。本文从统计学的视角出发,对统计学的课程思政目的进行深入探析,基于现阶段统计学的教和学现状,重构了统计学课程教学设计,在此思路下,对教学目的、教学内容、教学模式和教学评价进行了细化,深入挖掘教学体系中统计学专业知识与思政的衔接点,搭建“专业”+“思政”的教学内容。 文娟关键词:统计学 LSNCCP——一种基于最大不相含核心点集的聚类算法 被引量:3 2004年 聚类在数据挖掘、模式识别等许多领域有着重要的应用 提出了一种新颖的聚类算法 :一种基于最大不相含核心点集的聚类算法LSNCCP(aclusteringalgorithmbasedonthelargestsetofnot coveredcorepoints) 在密度定义的基础上 ,考察核心点之间的距离关系 ,定义相含、相交、相离这 3种核心点之间的关系 ,最后找出一个最大不相含核心点集 ,在此基础上进行聚类 ,并且找到解决丢失点问题的快速方法 该最大不相含核心点集只是全部核心点集合的一个很小的子集 ,因此有效地缩减了同类算法中搜寻核心点的时间 薛永生 翁伟 文娟 王劲波 张宇关键词:数据挖掘 聚类