徐京
- 作品数:4 被引量:3H指数:1
- 供职机构:安徽工程大学更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于领域本体的微博用户信息抽取方法被引量:1
- 2015年
- 传统基于本体的Web页面信息抽取以单个信息项为最小抽取单位,抽取出的实体语义关联性较差和抽取准确率不理想。针对上述问题,以微博领域本体为基础,提出了一种两层次匹配的用户信息抽取方法:将微博中具有语义关联的不同层次的用户信息划分成对应信息块,以信息块作为最小抽取单位分别抽取其中包含的用户各属性信息(包含个人信息、关注的好友信息和所发文本微博信息)。试验结果证明,与传统信息抽取方法相比,设计的抽取规则算法能够有效地提高信息的准确率和召回率,对微博页面结构复杂以及信息量大的Web网页有良好的抽取效果。
- 余伟陶皖徐京刘成满
- 关键词:领域本体信息抽取抽取规则
- 一种改进的PageRank算法被引量:1
- 2013年
- PageRank算法通过离线对网络链接图的邻接矩阵进行幂迭代,计算出各个网页的权威值。幂迭代法计算简单,特别适用于高阶稀疏矩阵,但是收敛速度不能令人满意。为了减少PageRank算法的迭代次数,将其转化为大型稀疏矩阵线性方程组问题,即视为求解方程组(P-E)X=0。采用MapReduce并行编程方法和Gauss-Seidel迭代法相结合求解方程组,使迭代次数更少,并行效率更高。
- 徐京陶皖
- 关键词:PAGERANKMAPREDUCEGAUSS-SEIDEL迭代法
- 本体技术在社交网站信息表示中的应用被引量:1
- 2013年
- 论坛、博客等社交网络应用已帮助人们在创建和收集了丰富的信息,由于各种社交网站中信息无法表述成机器可直接处理的形式,网站间缺乏信息共享和交流机制,使得大量的信息不能充分利用。在介绍本体技术的基础上,以音乐论坛类社交网站为例设计信息表示本体以形成概念化的共享表述。研究表明,利用该技术能够提高社交网络中的信息交互共享能力。
- 陶皖徐京刘成满
- 关键词:社交网站本体技术信息表示
- 基于云计算环境的Web结构挖掘算法研究
- 随着网络的快速发展,人们愈来愈频繁地在互联网上发布和获取信息,Web页已经成为主要的信息源。信息量在不断增大的同时亦带来了数据分析和挖掘过程中的各种挑战。Web结构挖掘技术通过研究Web页面之间的链接关系可发现Web中隐...
- 徐京
- 关键词:云计算HADOOPPAGERANKWEB结构挖掘
- 文献传递