洪佳明
- 作品数:29 被引量:127H指数:6
- 供职机构:广州中医药大学医学信息工程学院更多>>
- 发文基金:国家自然科学基金广东省自然科学基金广东省科技计划工业攻关项目更多>>
- 相关领域:自动化与计算机技术医药卫生文化科学电子电信更多>>
- 基于图的特征词权重算法及其在文档排序中的应用被引量:1
- 2012年
- 信息检索的核心工作包括文档的分类和排序等操作,如何对文档中的特征词权重进行有效度量是其中的一项关键技术。利用词的共现等关系为每个文档建立文本图,基于邻接词间重要性相互影响的思路,结合文档中特征词的词频特性,迭代计算每个词的权重,进一步结合文本图的密度等全局特性,对信息检索的结果进行排序。实验证实,算法在标准数据集上具有良好的效果。
- 黄云洪佳明颜一鸣
- 关键词:特征词权重
- 一种基于置信度的代表点选择算法被引量:1
- 2012年
- 代表点选择是实现缩减数据集规模的有效途径,可以提高分类的准确率和执行效率。为此,通过引入分类置信度熵的概念,提出适应度评价函数,用于评估代表点的选择效果,以此找到最优的代表点集。该方法可与其他代表点选择方法结合,得到性能更优的代表点选择方法。与多个经典代表点选择方法进行实验比较,结果表明基于置信度的代表点选择方法在分类准确率和数据降低率上有一定优势。
- 黄云洪佳明覃遵跃
- 关键词:半监督学习遗传算法
- 大型网络中近似子图匹配研究被引量:1
- 2012年
- 为降低噪声对近似子图匹配准确率的影响,提出一种改进的近似子图匹配方法。在预处理阶段,利用k-近邻顶点集为数据图中的每个顶点建立标签-权重向量索引。在查询过程中,基于单个近邻标签的权重距离和所有近邻标签的整体匹配程度进行两级过滤,生成顶点候选集,采用生成树匹配和图匹配的方式确定查询图在大型网络中的位置。在真实数据集上的实验结果表明,该方法具有较高的执行效率和匹配准确率。
- 黄云洪佳明覃遵跃
- 关键词:K-近邻
- 基于深度森林的产前胎儿监护不平衡多分类判别
- 2021年
- 采用深度森林框架构建基于不平衡电子胎心宫缩监护数据的多分类判别模型,验证模型有效性,结果表明该模型预测性能较好,极大降低误判率,在产前胎儿健康状况智能评估中有良好应用前景。
- 郭傲陈妍荻魏航陈沁群洪佳明李琼娜郝志峰
- TrSVM:一种基于领域相似性的迁移学习算法
- 迁移学习是对传统监督学习的扩展,试图利用其他相关领域中的现存数据来帮助完成当前领域的学习任务。对于归纳式迁移学习算法,当目标领域只有少量数据时,已有的算法容易受到选择性偏差的影响,不能充分发挥相关领域数据的作用。为解决该...
- 洪佳明印鉴黄云刘玉葆王甲海
- 关键词:支持向量机数据挖掘
- 基于单片机的电子价格标签演示系统软件开发
- 2016年
- 电子价格标签系统采用与店内数据库相连接的信号发射基站或手持装置,使用无线传输方式对电子价格标签的价格信息进行更新。为从根本上解决因使用纸质价格标签带来的商品标示与销售价格不符的问题,本文就电子价格标签的应用进行研究,并根据手持装置与显示装置之间的工作原理,开发由手持装置与显示装置组成的电子价格标签演示系统。本文重点介绍了该系统的软件部分。
- 郭颖朱陈兵郭天太洪佳明高嵘吴晓康
- 关键词:价格信息标签系统软件开发单片机显示装置无线传输方式
- 基于数据挖掘技术构建针灸古籍经验推荐平台的方法与应用被引量:9
- 2017年
- 目的:基于数据挖掘技术构建一个针灸古籍知识平台,供用户检索。方法:采用Oracle 10 g数据库,以JAVA为开发语言,在人工录入建立标准库、古籍资料库的基础上,综合多种数据挖掘技术,包括分词、词性标注、依存分析、规则抽取、相似度计算、歧义分析、监督分类技术实现自动的古籍文本抽取,最后通过关联挖掘、决策分析,实现全面的、智能化的分析针灸古籍中病症、经络、腧穴、刺灸法规律,并通过浏览器/服务器结构(Browser/Server,B/S)的方式供用户检索。结果:平台实现了全文检索、词频统计、关联分析等,检索病症或腧穴时,可以递减的方式显示治疗该病症的经络、腧穴(病症)、刺灸法的频次,同时显示病症与腧穴(特定穴)、病症处方中腧穴与腧穴、病症与刺灸法及腧穴与刺灸法的支持度和置信度。结论:基于数据挖掘技术构建的针灸古籍经验平台检索结果可作为针灸临床、教学中病症取经用穴的参考。
- 陈楚云洪佳明周蔚林林国华王正飞张去飞卢翠娜卢立宏
- 关键词:数据挖掘技术软件开发
- 基于布隆过滤器和B+树构建倒排索引的电子病历密文搜索被引量:4
- 2021年
- 电子病历包含病人的隐私信息,如何在保密情况下进行电子病历内容搜索是医院电子病历数据有效利用的难点。针对电子病历密文搜索,提出一种基于布隆过滤器(BF)和B+树的快速搜索方法。该技术对电子病历建立BF,按照倒排索引方式组织起来并建立B+树,能够支持在不泄露用户搜索关键词的前提下,对电子病历密文直接进行查询,安全级别达到IND-CKA级别。实验结果表明:由于使用BF与B+树结构,空间过滤特性高,无须解密即可达99%的过滤效率,查询效率高,且支持布尔查询,有效促进加密电子病历数据的应用。
- 王莱周腾达王正飞洪佳明
- 关键词:电子病历布隆过滤器B+树倒排索引
- 基于迁移学习的图分类被引量:4
- 2011年
- 数据挖掘是从大量数据中提取隐含知识的过程.随着数据挖掘的广泛应用,图作为一种一般数据结构在复杂结构和它们之间相互作用建模中变得越来越重要,这使得图挖掘成为数据挖掘的一个新的热点研究方向之一.由于图分类具有许多真实的应用背景,因而图分类已成为图挖掘中重要的研究领域.目前对图分类的研究都基于一个假设:训练集和测试集都是来源于同一个分布.然而,在很多真实的应用上,训练集和测试集不一定是来自同一个分布的.在本文中,我们将学习如何运用迁移学习的方法来对图数据进行分类,并提出一个基于集成学习的算法TrGBoost,该算法能在少量有标签的图数据和大量相关的图数据集里,有效地建立一个图分类器.真实数据上的实验验证了本文算法的有效性.
- 陈炳超洪佳明印鉴
- 关键词:BOOSTING
- 基于数据挖掘技术分析《神应经》病症经穴应用规律被引量:4
- 2016年
- 【目的】运用数据挖掘技术分析《神应经》中病症与经脉、穴位应用和穴位配伍的关系。【方法】建立病症、经络、刺灸法、穴位标准库和《神应经》资料库,统计《神应经》中病症各部所取的经络频次与频次最高的穴位;采用Apriori算法实现配伍关系的分析,经测试界定经络配伍和腧穴配伍关系的支持度和置信度,计算经络、腧穴项集的支持度和置信度。【结果】全书病症有547条,共用穴246个、2 029频次,其中用穴频次最高的是三里(手三里和足三里),合谷次之,经脉频次最高的是足太阳膀胱经。足少阳胆经与足太阳膀胱经同时出现的概率最高,为10.17%;处方中出现足阳明胃经、足少阴肾经时,足太阳膀胱经出现的概率最高,为72.73%;曲池与合谷同时出现的概率最高,支持度为3.67%,其次是三里、合谷与曲池;处方中存在肩髃时,曲池出现的概率最高,达88.89%。【结论】运用数据挖掘技术对《神应经》病症经穴应用规律的分析结果可为现代中医针灸与临床提供参考。
- 陈楚云李丽霞洪佳明林国华谢丽琴
- 关键词:数据挖掘