吴信东
- 作品数:157 被引量:674H指数:13
- 供职机构:合肥工业大学更多>>
- 发文基金:国家自然科学基金国家重点基础研究发展计划长江学者和创新团队发展计划更多>>
- 相关领域:自动化与计算机技术历史地理文化科学经济管理更多>>
- 从大数据到大知识:HACE+BigKE被引量:10
- 2016年
- 本报告主要包括:1)大数据研究背景与动机;2)5V,5R,4P与HACE定理;3)大数据知识工程;4)大知识的挑战与前景展望4个方面的内容。1大数据的研究背景与动机20世纪90年代,"数据仓库之父"Bill Inmon开始关注大数据(海量数据)。简而言之,大数据是无法在合理的时间内利用现有的数据处理手段进行诸如存储、管理、抓取等分析和处理的数据集合。
- 吴信东
- 关键词:知识工程知识获取知识推理专家系统并行处理多模态
- 基于密度聚类模式的中文新闻网页关键词提取被引量:3
- 2009年
- 关键词在文本聚类/分类、自动摘要、信息检索等领域具有重要地位,然而当前互联网上的众多新闻网页没有提供关键词,人工标注关键词代价巨大,并且大多数已有的关键词自动提取算法都需要建立在人工标注的训练集之上,因而难以实用。由于关键词是文章中较重要且主题关联较凝聚的词的集合,因此提出一种基于密度聚类模式的中文新闻网页关键词提取方法,根据词语之间的共现信息,对网页分词后的词语进行聚类,在分析词语关联度的基础上提取出反映新闻主题的关键词。通过大量随机新闻网页实验结果表明,与单纯的TF/IDF(词频和文档频率倒数的乘积)方法相比,此算法召回率平均提高了7.15%,准确率平均提高了7.075%。
- 尹倩胡学钢谢飞吴信东
- 关键词:关键词提取词共现聚类自然语言处理
- MapReduce与Spark用于大数据分析之比较被引量:69
- 2018年
- 评述了MapReduce与Spark两种大数据计算算法和架构,从背景、原理以及应用场景进行分析和比较,并对两种算法各自优点以及相应的限制做出了总结.当处理非迭代问题时,MapReduce凭借其自身的任务调度策略和shuffle机制,在中间数据传输数量以及文件数目方面的性能要优于Spark;而在处理迭代问题和一些低延迟问题时,Spark可以根据数据之间的依赖关系对任务进行更合理的划分,相较于MapReduce,有效地减少了中间数据传输数量与同步次数,提高了系统的运行效率.
- 吴信东嵇圣硙
- 关键词:大数据MAPREDUCESPARK
- 基于径向基函数神经网络的多样化图像标注和检索方法
- 本发明公开了一种基于RBFNN的多样化图像标注和检索方法,包括:(1)构建和学习RBFNN模型,构建出能覆盖图像“子概念”的RBFNN模型;(2)将检索资料库预处理后的数据输入步骤(1)构建的RBFNN模型中,对图像库中...
- 赵仲秋季海峰谢宝剑黄德双吴信东
- 文献传递
- 数据集成方法及装置
- 本申请公开了一种数据集成方法及装置。其中,该方法包括:获取多个原始数据源,原始数据源包括图像数据源和文本数据源;对多个原始数据源进行去冗余处理,得到处理后数据源;依据处理后数据源分别构建与每个原始数据源对应的局部本体,得...
- 吴信东董丙冰朱毅
- 文献传递
- 药物-疾病关系预测:一种推荐系统模型被引量:6
- 2015年
- 目的药物重定位是指发掘已有药物新的治疗作用,然而具有潜在治疗作用的药物-疾病往往隐藏在数以百万计的关系对中。该研究基于医疗大数据分析,预测具有潜在治疗关系的药物-疾病关系对。方法将社交网络中推荐系统模型应用于药物重定位研究,并假设具有相似化学结构的药物可能具有相似的适应症。从开源数据库收集已知药物-疾病的治疗关系、副作用关系以及药物和疾病特征描述符,计算得到药物-药物的相似度和疾病-疾病相似度,再构建推荐模型将上述信息融合,并预测具有潜在治疗关系的药物-疾病,最终得到预测关系对的排序列表。结果列表排名前500的关系对中,有12.8%得到临床实验支持或综述报道,20%得到模式生物实验或细胞实验支持。结论相比于已有分类模型和随机抽样结果,本模型可明显提高具有潜在治疗作用药物-疾病的富集程度。
- 汪浩王海平吴信东刘琦
- 关键词:推荐系统协同过滤
- 一种基于多RBFNN分类器集成的多样化图像标注和检索方法
- 本发明公开了一种基于多分类器集成的多样化图像标注和检索方法,该方法主要包括四个步骤:(1)构造和学习多个差异性RBFNN集成分类器模型;(2)利用优化后多个差异性RBFNN集成分类器模型来对检索图像库中图片进行多样化标注...
- 赵仲秋季海峰高隽吴信东
- 文献传递
- 生产式知识结构的内部表示被引量:2
- 1990年
- 本文以专家系统中使用得较为普遍的产生式表示为例,探讨专家系统知识库级知识内部表示的几种模式及相应的知识获取和推理机制的设计。
- 吴信东
- 关键词:专家系统知识结构
- 安徽省舒城县农村能源区划规划
- 章学筠丁耀仁谢昭双黄曙王明全吴信东邵太法黄庆敏方成俊王学伦邓慎康
- 该规划是运用系统工程的规点和生态学、经济学的原理进行研究的。供气大部分组成:(1)分析了消费构成;(2)调查了开发潜力;(3)分析了供需现状;(4)预测了今后的供需量;(5)对全县进行了分区划片,以便分类指导;(6)建立...
- 关键词:
- 关键词:农村能源
- 利用项集有序特性改进Apriori算法被引量:11
- 2004年
- Apriori算法是挖掘关联规则的一个经典算法,通过分析、研究该算法的基本思想,并利用项集的有序特性对其进行改进,减少了生成的候选集数量,从而提高算法的效率.
- 刘美玲徐章艳卢景丽区玉明袁鼎荣吴信东
- 关键词:APRIORI算法挖掘关联规则非频繁项集数据挖掘