杨文军
- 作品数:3 被引量:7H指数:2
- 供职机构:中石油规划研究院更多>>
- 发文基金:国家高技术研究发展计划国家教育部博士点基金更多>>
- 相关领域:自动化与计算机技术理学更多>>
- 基于话题模型的学术社会网络建模及应用被引量:3
- 2011年
- 传统方法通常对异构数据进行独立建模,忽略了它们之间的依赖关系。针对这一问题,重点研究了如何对学术网络进行统一建模;如何利用学术网络中的网络信息提高建模效果。提出学术社会网络的统一建模模型——作者会议引用话题模型(Author-conference Citation Topic Model,简称ACCT模型),该模型通过话题分布统一描述了学术社会网络中的多种异构数据的特点,如论文、会议、作者和引用等,并描述了这些不同数据之间的依赖关系。其建模结果可直接用于学术信息检索和学术推荐。在ArnetMiner系统的数据集上对ACCT模型进行了实验验证,实验结果表明,ACCT模型在学术推荐上优于基线模型。
- 唐杰宫继兵刘柳杨文军
- 关键词:正则化
- 基于权威度的指导者挖掘与个性化推荐方法被引量:1
- 2011年
- 在学术搜索引擎Arnetminer提供的数据中,对师生关系进行了挖掘,并在此基础上,结合用户信息,进行个性化的指导者推荐。计算出指导者的权威度和申请者的申请成功率。针对这两方面的内容,分别基于排序支持向量机模型和概率模型设计了基于权威度的推荐模型和基于个性化的推荐模型。研究成果成功应用于Arnetminer系统中,并可实时收集用户反馈信息以提高师生关系挖掘的准确率和推荐模型质量。
- 王喆唐杰宫继兵杨文军
- 关键词:个性化推荐模型
- 通用抽取引擎框架:一种新的Web信息抽取方法的研究被引量:4
- 2011年
- 大规模的网络视频信息既为用户信息分享带来了方便,同时也为国家监管部门带来了新的挑战。考虑到效率问题,在线视频监管则主要考虑视频描述信息。主要研究了网络视频描述信息的抽取问题,提出了一种新的Web信息抽取方法:通用抽取引擎框架,其主要包括对视频描述信息抽取问题的形式化描述和用户感知的视频网站逻辑模型。该方法在国家某部委的视频监管项目中已得到应用,并取得了很好的效果。实验结果表明,该方法的扩展性、通用性和抽取准确率大大优于其他方法。
- 宫继兵唐杰杨文军
- 关键词:WEB信息抽取