中国人民大学科学研究基金(12XNLJ01)
- 作品数:1 被引量:4H指数:1
- 相关作者:王雪周烜王珊更多>>
- 相关机构:中国人民大学更多>>
- 发文基金:中国人民大学科学研究基金教育部“新世纪优秀人才支持计划”国家自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 混合的大规模数据库自动模式抽象方法被引量:4
- 2013年
- 随着数据库规模的扩大,其模式的复杂度也不断地增加,复杂的模式和文档的缺乏使得理解和操作数据库更加困难.现有的模式抽象方法大多通过关系表中的主外键信息查找出模式中最重要的表,然后使用这些最重要的表来构成单层次的模式总结.在现实应用中,这些模式总结的主题并不明确.文中陈述了现有方法的不足,然后给出了一种为大规模数据库生成多层次模式抽象的方法.在此方法中,首先使用不同类型的社区社团检测算法来将数据库模式划分为"团",然后使用元聚类方法将这些"团"集成为数据库的主题组,每一个主题组代表数据库的一个主题.最后将这些主题组进行进一步的聚类以生成主题组类,并为每一个主题组类挑选标签以生成多层次的模式抽象.在Freebase——开源的大规模数据库上验证了文中算法的有效性.实验证明文中算法不仅能够精确地识别大规模数据库的主题,同时可以依据数据库的主题生成易于理解、能够帮助用户浏览和检索数据库的多层次模式抽象.
- 王雪周烜王珊
- 关键词:大规模数据库